[언론보도] 윤성로 교수, [빅데이터로 보는 경제]딥러닝에 가장 중요한 건 '빅데이터'(뉴시스,2016.04.14)
윤성로 서울대학교 전기정보공학부 교수
"딥러닝(Deep Learning)은 오래된 기술이다. 다만 3요소가 갖춰지지 못했었기 때문에 최근에서야 부각되고 있을 뿐이다."
윤성로 서울대 전기정보공학부 교수는 딥러닝 발전을 위한 요소들로 ▲빅데이터 ▲병렬 하드웨어 ▲알고리즘을 꼽았다. 그러면서 한국은 빅데이터와 하드웨어 측면에서 강점이 있다고 강조했다.
머신·딥러닝 분야 전문가인 윤 교수는 서울대 빅데이터연구원 바이오응용부 부부장을 겸임하고 있다.
윤 교수는 "한국은 양질의 데이터가 많고, 반도체 같은 하드웨어 쪽에서도 강점이 있다"며 "시간이 필요하기는 하겠지만 해외와의 기술 격차는 충분히 줄일 수 있는 수준이라고 본다"고 말했다.
윤 교수는 딥러닝의 가장 중요한 요소로 '빅데이터'를 꼽았다. 딥러닝이 자기 학습을 하기 위해서는 사례가 많아져야 하기 때문이다.
윤 교수는 "아이디어가 아무리 좋고 하드웨어가 100만대 있어도 데이터가 없으면 아무것도 시작할 수 없다"며 "딥러닝에서 가장 중요한 것은 빅데이터"라고 말했다.
이어 "과거의 인공지능은 구동 조건을 사실상 개발자가 지정하는 일종의 법칙 기반으로 갈 수 밖에 없었다"며 "데이터가 많이 쌓이게 되면 예외나 돌발 상황에까지 유기적으로 대처할 수 있게 된다"고 했다.
그는 최근의 딥러닝을 '인공 신경망을 빌딩처럼 쌓아 놓고 혼자서 단계적으로 배워나가는 기술'으로 정의했다.
인공 신경들을 여러 겹으로 쌓고, 층마다 단계별로 구체화하는 방식의 학습을 진행하는 기술이 그가 말하는 딥러닝이다.
예컨대, 딥러닝으로 자동차를 학습한다면 첫 번째 인공신경망 층은 형체를 구분한다. 다음 층에서는 자동차라는 사실을 인지하고, 세 번째 층에서는 어떤 차종인지를 구별하는 식으로 내밀하게 학습을 이어나간다.
딥러닝 구조에 대한 아이디어는 1950년대부터 이미 존재했다. 하지만 실제 학습 진행 단계를 이어갈 방법이 없어 잠자고 있는 기술에 그치고 있었다.
그러던 가운데 지난 2006년 층별로 신호를 보정하는 기술이 등장했고, 빅데이터와 반도체 인프라가 이를 뒷받침 하면서 지금의 딥러닝에 이르렀다.
정보를 단계별로 다루는 딥러닝 기술은 금융 분야에서도 활용 가능성이 있다. 나이·성별·주소·직업 등 다양한 변수를 층별로 적용하고 가중을 두면서 개별 은행의 대출 승인 과정을 자동화할 수 있다고 윤 교수는 설명했다.
하지만 딥러닝이 모든 분야의 만능 기술인 것은 아니다. 이름은 딥러닝이지만 어떤 기술은 음성 인식에, 또 다른 기술은 영상 분석 등 분야별로 특화돼 있다.
일례로, 이세돌과 대국을 했던 구글의 알파고에는 바둑판을 영상으로 인식하는 딥러닝 기술이 쓰였다. 반면 삼성전자의 휴대폰에는 국내에서 개발한 음성인식 딥러닝 기술이 내재돼 있는 식이다.
그는 딥러닝의 발전이 직업과 산업 차원에서의 변화를 불러올 수 있다는 입장이다. 종래의 전문직의 역할이 줄어들고, 제조업 분야에서 새로운 먹거리가 생길 수도 있다는 게 그의 견해다.
로봇이 의료 진단 결과를 판독하거나 판례를 조사하는 일을 대체하고, 전문직의 역할은 수술을 할지, 구형 여부를 '결정'하는 것만으로 줄어들 수 있다는 뜻이다.
아울러 딥러닝 기술에 맞는 하드웨어 등을 개발하기 위한 기존 제조업 분야의 개선, 또는 새로운 형태의 산업이 출현할 수도 있다고도 그는 설명했다.
윤 교수는 "현재의 컴퓨터 구조는 딥러닝을 구현하는데 적합하지 않다"며 "딥러닝에 적합한 새로운 구조 인프라 분야에서 제조업이 발전하게 될 가능성이 있다"고 말했다.
윤 교수는 앞으로의 딥러닝은 지능칩 형태로 발전할 것이라고 전망했다.
설계도만 넣으면 다양한 제품이 나오는 3D 프린터 같이, 단계별 자기 학습을 하도록 설계된 칩을 필요에 따라 여러 용도로 사용할 수 있게 된다는 것이다.
그는 한국이 세계 딥러닝 시장에서 경쟁력을 확보하기 위해서는 정부와 기업의 역할이 중요하다고도 했다.
빅데이터와 인프라를 충분히 갖추고 있는 기업들 사이의 연계, 정부가 보유한 정보, 의료 정보 등에 대한 접근 문턱이 낮아지면 딥러닝 발전이 촉진될 수 있을 것이라고도 했다.
윤 교수는 "심지어 구글같은 경우도 음성 인식 한 번 학습하는데 2주 정도 걸린다"며 "빅데이터가 있고 인프라가 구축된 곳들이 서로 연계해 데이터를 모아야 할 것"이라고 강조했다.
또 "전통적으로 한국의 하드웨어는 강세이기 때문에 인프라 기반은 어느 정도 있는 상황"이라며 "수준별 소프트웨어 교육이 이뤄질 수 있는 환경을 마련하는 방안도 고려해볼 수 있을 것 같다"고 말했다.