구글의 자연어 처리 오픈소스 SyntaxNet

구글에서 자연어 처리 오픈소스인 SyntaxNet을 발표했다는 소식은 구글 리서치 블로그[1]에서 이미 들은 바 있는데, 그 글을 번역한 어느 블로거의 고마운 글[2]이 있어 걍 링크해 본다. 본인과 같은 영어 울렁증 환자에게 큰 도움이 된다. ㅋㅋㅋ

일전에 gaussian face이야기를 했지만, 자연어 처리라든지 얼굴 인식이라든지 컴퓨터보다 인간이 우월한 다양한 분야에서 기계학습이 적용되고 있는 것 같다. 아마 SyntaxNet을 이용한 암 연구도 곧 볼 수 있을 듯.

위 블로그의 글에 왜 자연어 처리가 어려운지 짧은 설명이 있다. 인간이라면 쉽게 배제할 수 있는 두 번째 해석을 기계가 배제하기 어렵기 때문이라는 이야기가 나온다. 개인적인 생각으로는 제대로 된 자연어 처리라면 인간처럼 ‘차안에 거리가 위치하는 것은 말이 안 되므로 이 해석을 배제한다’라고 생각할 수 있어야 한다고 본다. 구글은 두 번째 해석의 배제를 위해 기계학습을 이용하고 있지만, 이는 자연어 처리의 문제를 언어만으로 해결하려고 하기 때문에 나오는 미봉책이 아닌가 싶다. 진정한 자연어 처리를 하려면, 인간이 가진 대부분의 보편적 상식을 기반으로 하는 머신이 반드시 필요할 것이다.

 


[1] Announcing SyntaxNet: The World’s Most Accurate Parser Goes Open Source in Google Research Blog
[2] Google 자연어 처리 오픈소스 SyntaxNet 공개 by CPUU

답글 남기기

아래 항목을 채우거나 오른쪽 아이콘 중 하나를 클릭하여 로그 인 하세요:

WordPress.com 로고

WordPress.com의 계정을 사용하여 댓글을 남깁니다. 로그아웃 / 변경 )

Twitter 사진

Twitter의 계정을 사용하여 댓글을 남깁니다. 로그아웃 / 변경 )

Facebook 사진

Facebook의 계정을 사용하여 댓글을 남깁니다. 로그아웃 / 변경 )

Google+ photo

Google+의 계정을 사용하여 댓글을 남깁니다. 로그아웃 / 변경 )

%s에 연결하는 중