점(노드)과 점, 그리고 두 점을 잇는 선(링크). 세상의 네트워크를 설명하는 단위는 너무도 단순하다. 점들을 순서대로 쫓아 이어 그리기를 하던 추억은 우리에게 친숙하고, 또 여러 점들을 하나의 선으로 잇는 ‘한 붓 그리기’ 문제는 수학에서 오랫동안 전통적인 연결망 문제였다. 그런 연결선이 수억, 수십억 개 모이고 점과 점의 상호작용이 복잡하게 얽히고설킬 때, 우리는 거기에서 ‘복잡계’를 본다. 그런 복잡계에선 노드와 링크의 총합만으론 설명할 수 없는 또 다른 현상, 이른바 ‘창발’ 현상이 일어난다. 그게 복잡계가 간직한 비밀이다.
복잡계와 더불어 네트워크 이론에 대한 관심도 높아지고 있다. 때로는 처세술이나 마케팅 기법으로 주목받지만, 네트워크 이론 연구자인 정하웅 카이스트 교수(물리학)는 “복잡계의 근원적인 물음에 답하려는 또 하나의 시도가 네트워크 구조와 역동성을 연구하는 네트워크 과학”이라고 말한다. ‘네트워크가 펼치는 세상’에 관해 그의 얘기를 들어봤다.
정하웅 교수는 누구?
복잡계 네트워크 과학’이라는 분야를 개척해온 주요 연구자들 중 한 명으로 꼽힌다. 미국 노터데임대학에서 박사후연구원으로 있던 1999~2001년에 <네이처>에 5편의 논문을 잇달아 쓰면서 주목 받았다. 물리·생물·전산·사회·경제학 등 영역에서
다양한 연결망의 구조와 성질을 연구하며, 총 인용횟수 8천 번이 넘는 논문들을 발표해왔다. 최근엔 미래 인터넷과 소셜네트워크에 대해서도 연구하며 네트워크 안에서 일어나는 동역학의 문제에도 관심을 기울이고 있다.
△카이스트 교수(물리학) △교육과학기술부 ‘ 이달의 과학기술자상’(2010년 5월)
정하웅 교수에게 듣는 네트워크 과학 뜻밖의 ‘멱함수’ 규칙 발견
‘허브’의 발견은 그한테 운이 좋게도 뜻밖으로 찾아왔다고 한다. 그 발견 전까지 세상의 연결망들은 흔히 고속도로망처럼 대체로 정렬된 모습으로 그려졌다. 하지만 실제는 달랐다. 1999년 정 교수는 박사후연구원으로 있던 미국 노터데임대학에서 바라바시 교수와 함께 “자투리 일로 재미삼아” 월드와이드웹의 연결망 구조를 분석했고, 거기에서 그들은 아주 새로운 네트워크의 성질을 찾아냈다. 고속도로망에선 볼 수 없는, 수만의 연결선을 거느린 ‘허브’라는 강자였다.
정하웅 교수에게 듣는 네트워크 과학 웹페이지 연결망 구조 분석하다많은 연결선 거느린 ‘허브’ 찾아다양성 보여주는 멱함수 발견
1999년 <네이처>에 발표한 논문이 네트워크 과학의 본격 시작을 알리는 논문들 중 하나로 꼽히는데요. 어떤 건가요?
“원래 프랙털이 전공이었는데, 우연히 네트워크 연구를 시작했어요. 바라바시 교수의 제안으로 방학 때 자투리 일처럼 시작했죠. 웹 페이지들이 서로 어떻게 연결돼 있나, 그 구조를 보려는 것이었는데요, 연결선의 분포를 분석하다 보니 거기에서 ‘멱함수 분포’가 나오더라고요. ‘어, 이거 재밌겠다’ 퍼뜩 생각이 들어 더 많은 웹 페이지를 분석했고, 그러면서 일이 커진 거죠. 달랑 한 쪽짜리 논문이었지만 영향력은 컸어요.”
‘멱함수 분포’를 발견했다는 게 왜 중요하죠?
“멱함수란 어떤 양이 ‘서서히’ 줄어드는 분포를 보여줍니다. 애초엔 고속도로 연결선이 그런 것처럼 웹 페이지 연결선도 대부분 평균 수십 개 정도에 분포할 걸로 예상했는데, 실제 조사해보니 수만 개 연결선을 지닌 것도 있었죠. 그게 멱함수 분포라는 건데요, 연결선이 수십 개다, 수백 개다 이렇게 평균해 말하기 힘든 분포라는 거고, 거기엔 심지어 수만 개 연결선을 지닌 것도 일정 확률로 존재한다는 겁니다. 다양성이 있다는 거죠. 멱함수 분포가 있다는 것은, 달리 말해 ‘임계현상’처럼 흥미롭고 신기한 현상들이 많이 일어날 수 있다는 뜻이어서, 네트워크 연구가 주목받기 시작했던 거죠.”
한해 앞서 ‘세상 사람들은 여섯 단계를 거치면 모두 연결된다’는, 스탠리 밀그램의 이른바 ‘좁은 세상’ 논문도 있었지요?
“재미있고 중요한 논문이었지요. 네트워크 과학이 본격화하면서 새롭게 조명받았고요. 거기에선 멱함수나 허브 개념은 없었는데, 사실 ‘허브가 있어서 세상은 좁다’고 말할 수 있게 된 셈이죠.”
멱함수(오른쪽)는 네트워크에서 얼마나 많은 점들이 몇 개의 연결선으로 연결돼 있는지를 보여주는 연결선 분포 함수다. 우리에게 익숙한, 평균 주변에 많이 모여 있는 종 모양의 ‘가우시안 분포’(왼쪽)와 달리, 멱함수 분포는 많은 연결선을 지닌 허브를 비롯해 다양성이 존재함을 보여준다.
어라, 세상 네트워크가 비슷”
네트워크 연구의 전성시대 같다. 여러 분야에서 네트워크 연구가 이어졌고 언론에도 흥미로운 기사로 보도됐다. 단백질 분자들의 반응 연결망에서도 멱함수와 허브가 확인됐고, 심지어 섹스 연결망에서도 허브 구실을 하는 ‘카사노바’의 존재가 확인됐다. 인간사회나 분자들의 상호작용 연결망에서 비슷한 구조와 성질이 발견된다는 사실은 그동안 네트워크 과학이 확인해준 흥미로운 대목이었다.
2000년대에 네트워크 연구 대상이 엄청나게 다양화했지요?
“그럴 수밖에 없는 게 사실 다 네트워크거든요. 예를 들어 생체분자들이 화학결합을 해서 다른 분자를 만들고 또 다른 분자를 만들고 하는데, 그게 신진대사 네트워크이고요. 단백질과 단백질이 결합해 어떤 일을 하는지 보여주는 단백질 반응 연결망도 있고요. 이메일과 전화 연결망에 대한 분석도 있었고, 심지어 언어학에서 비슷한 단어를 이어 만든 연결망에서도 멱함수 분포가 나온다는 게 알려졌고요. 갖가지 영역을 조사해보니까 멱함수 분포가 자꾸 나온다는 겁니다. 국가간, 기업간의 경제활동 연결망에서도 멱함수가 나오고, 계속 발견되고 있죠.”
여러 네트워크에 멱함수, 허브가 있다는 건 신기한데 그게 대체 어떤 의미인지?
“초반엔 그런 발견 자체에 관심이 쏠렸죠. 하지만 왜 그런지, 그게 어떤 의미인지 설명이 필요해요. 노터데임대학에 있을 때 두번째 <네이처> 논문을 냈는데, 표지 논문으로 실렸어요. 허브가 ‘인터넷의 아킬레스건’이 될 수 있다는 게 요지였습니다. 허브가 망가지면 끝장이니까요. 하지만 그런 허브엔 강점도 있어요. 누가 일부러 허브를 공격하면 연결망은 치명적 피해를 입겠지만, ‘자연스런 고장’의 측면에서 보면 허브의 존재는 강점이라는 거죠. 고장이야 언제 어디에서 날지 모르고, 그 대상이 허브가 될 확률은 굉장히 낮아지거든요. 그래서 복잡계의 특징 중 하나가 ‘튼튼하다’는 것인데, 생명체도 마찬가지입니다. 우리 몸에선 늘 일정 확률로 잘못된 반응이 일어나게 마련이지만, 다행히 허브 구조여서 그런 일은 거의 대부분이 허브 아닌 곳에서 일어나니까요.”
인간사회, 생체분자, 그리고 무생물의 네트워크에 차이점은 없나요?
“생명체는 오랜 진화의 산물인데, 인간이 만든 인터넷 연결망과 같을 수야 없겠죠. 재미있는 차이점으로, 이런 게 있습니다. 네트워크는 ‘좁은 세상’이기는 하지만, 똑같이 나타나진 않는다는 거죠. 인터넷에선 규모가 커지면 최대 연결 거리도 조금씩은 늘어나거든요. 하지만 신기하게도 생명체에선 달라요. 43가지 박테리아와 진핵 세포들의 신진대사망을 비교한 적이 있는데, 거기에선 고등이건 하등이건 최대 연결 거리가 3단계로 늘 일정하게 나타났죠. 생명체는 진화 과정에서 더 복잡한 연결망을 갖더라도 외부 자극에 대해 반응물질을 만들어내는 연결 거리는 늘 일정하게 유지하는 것 같아요. 또 다른 연구들을 보면, 인간사회 네트워크에선 허브들끼리 뭉치는 경향이 짙습니다. 인터넷이나 세포 안 네트워크에선 허브끼리 뭉치는 일이 매우 드물거든요. 이런 게 소셜네트워크만의 특징 같지만, 왜 그런지는 아직 모르죠.”
인간사회·생체분자 네트워크 점과 선 연결망으로 단순화해 엑스레이 영상처럼 뼈대 보여줘
복잡계, 규칙과 무질서 사이
물리학자들이 연구 대상으로 삼는 복잡계는 규칙과 무질서의 중간쯤에 있고, 그래서 ‘혼돈의 가장자리’라는 별칭도 얻고 있다. 어찌 보면 복잡계가 매력적인 연구 대상이 되는 것은 이 때문이다. 완전히 무질서도 아니고 규칙도 아니기에, 그 ‘가장자리’에선 과학과 자연의 절묘한 숨바꼭질이 벌어진다. 정 교수는 네트워크 과학을 “복잡계를 점과 선의 연결망으로 단순화해 복잡계의 뼈대를 얼핏 들여다볼 수 있게 해주는 엑스레이 영상”이라고도 풀이했다.
-지금까지 여러 네트워크들에 대한 사례연구들이 주로 이어졌지, 네트워크의 보편적 속성이나 원리에 대한 이해는 부족한 것 같아요.
“네트워크 연구는 아직 걸음마 단계죠. 하지만 갖가지 네트워크 사례들을 연구하다 보면 점차 보편적인 성질도 발견되리라고 봐요. 제가 보기에, 네트워크는 복잡계를 연구하는 새로운 패러다임이고, 그래서 복잡계에 숨어 있는 원리를 찾는 데 큰 도움을 줄 거라고 믿죠. 특히나 복잡계의 큰 화두인 ‘창발’ 현상을 설명할 수 있어야겠죠. 뇌의 작용이 전기신호의 흐름이라고 해서 건전지로 전기신호를 주고받는다고 지성이 나오지 않는 것처럼, 구조를 넘어서서 무언가 숨은 원리를 찾아내야겠죠.”
-네트워크 과학이 복잡계 연구에 무엇을 기여할 수 있나요?
“복잡계엔 무수한 개체들과 무수한 상호작용이 있습니다. 하지만 그런 복잡함을 점과 선의 연결망 구조로 단순화하면 복잡계를 이해하는 데 도움이 될 겁니다. 네트워크는 어찌 보면 ‘복잡계의 엑스레이 영상’ 같은 거죠. 복잡계의 뼈대를 어느 정도 보여주는데, 그 뼈대의 숫자도 엄청 많으니 그걸 제대로 보려면 통계물리학이 또 필요한 거고요.”
-복잡계를 이해하는 데 중요한 도구가 될 수 있다고 보시는군요.
“복잡계는 21세기의 중요한 화두죠. 그동안 다루기 힘든 대상이었지만 사실 복잡계의 중요한 특징 중 하나는 ‘너무 단순하지도, 너무 복잡하지도 않다’는 것이거든요. 우리 사회도 중간 정도로 복잡해서 재미있는 거죠. 세상이 완전히 질서정연해서 바둑판처럼 다 똑같다면 우리는 길을 찾아갈 수 없을 거예요. 또 완전히 엉망진창이라면 거기에서도 길 찾기는 힘들겠지요. 세상은 적당히 복잡하고 적당히 질서정연한 그 중간인 거죠. 그게 세상의 복잡계이고, 그래서 네트워크 과학도 가능한 거고요.”
데이터의 능력, 사회현상 예측
- ‘데이터’를 강조하시는데요, 데이터가 어떻게 활용된다는 건가요?
“사실 네트워크 과학은 무수한 데이터가 있었기 때문에 발전할 수 있었던 거죠. 수학 이론만으로 네트워크를 연구하는 게 아니라 실제 데이터로 네트워크 구조를 봤더니 이러저러하다는 연구결과가 나오고 있는 거니까요. 이른바 ‘데이터 과학’은 이미 여러 분야에서 주목받고 있어요. 예를 들어 2008년 구글의 연구소에서 논문을 낸 적이 있는데, 2003~2007년의 검색어 데이터베이스를 분석해 독감환자 발생과 관련한 검색어 50개를 찾아냈고 그것을 써서 어느 지역에 독감환자가 발생하는지 재빨리 찾아내, 미국 질병관리센터(CDC)의 환자 집계자료보다 먼저 맞힌 적이 있죠.”
- 데이터 과학이 소비심리를 조작하거나 사회현상을 조작하는 데 잘못 쓰일 수도 있겠네요.
“맞습니다. 좋게 쓰려면 한없이 좋게 쓰겠지만 나쁘게 쓰면 한없이 나쁘게 쓸 수도 있죠. 그런 점에서 안타까운 것은 법과 제도가 과학의 발전 속도를 따라오지 못한다는 겁니다. 전염병 차단처럼 좋은 목적으로 데이터를 쓸 수 있게 데이터의 공개 범위나 관리 방식에 관해 활발한 논의가 필요하거든요. 그래야 연구자들도 마음 놓고 데이터를 이용할 수 있을 테니까요.”
대전/글 오철우 기자 cheolwoo@hani.co.kr
사진 조소영 피디 azuri@hani.co.kr