검색엔진 기록을 토대로 췌장암 환자 찾아내기

해커뉴스에서도 소개[1]되어 있어 이미 많이 알 듯 하지만, 괜히 한번 포스팅 해본다. ㅋ

췌장암은 초기 증상이 거의 없어서 조기발견이 어렵고, 치료후 5년 생존률이 5%정도 밖에 안 되는 악명이 높은 암이라고 한다. 췌장암을 조기발견하면 어느 정도 이득이 있는 모양인데, 뉴욕타임즈 기사[2]에서 검색엔진 기록을 토대로 췌장암 환자를 조기발견하는 방법에 관한 논문[3]을 소개하고 있어서 대~충 봤다-_- 논문은 무료로 볼 수 있는 듯 하다.

췌장암 환자가 크게 아프지 않더라도 자신의 몸에서 약간 이상함을 느껴서, 이와 관련된 검색을 스스로 하게 되는 경우가 있는데, 이 검색어의 추이를 통해 췌장암을 검출할 수 있다는 내용 같다. 익명화된 검색 로그를 이용했기 때문에, 연구자들은 검색을 한 개인과 직접 접촉하지는 않았다고 한다. 마이크로소프트에서 연구했기 때문에 검색엔진은 Bing을 쓴 모양인데, 요새 Bing 쓰는 사람 있나-_- ㅋㅋㅋㅋ 웬만하면 구글이랑 협조 좀 하지 ㅋㅋ

3페이지에 흥미로운 내용이 있는데, 사람이 검색한 예시로 “Just diagnosed with pancreatic cancer”, “Why did I get cancer in pancreas”, “I was told I have pancreatic cancer, what to expect.” 가 있다고 하는데, 진짜 이렇게 자연어로 검색하는 사람이 그렇게 많은 건가??? 본인은 거의 대부분 키워드 중심의 검색만을 사용하고 있어서 잘 모르겠다. ㅋ

여하간 이런 문구를 입력하여 확실히 진단을 받았다고 추정되는 사람들의 과거 검색기록을 거슬러 올라가서 징후가 나타났었는지 확인하는 식으로 연구한 것 같다.

논문 자체는 모르는 통계 용어가 너무 많아서 읽다가 접었다-_- 뭐 항상 이런 식이긴 하다 ㅋㅋ 여하간 이런 마이닝 기술이 진보해서, 뭐 좀 검색하다보면 검색엔진이 알아서 분위기 파악하면서 생활의 꿀팁을 비교적 정확하게 제시하면 좋겠다. 한편으로는, 속이 더부룩해서 검색좀 했더니만 갑자기 검색엔진이 “당신은 간암이 의심됩니다!” 하면 놀래 기절하지 않을까-_- 싶기도 하다.

일전에 자연어 처리 기술로 암연구를 한다는 이야기[4]를 했는데, 여러 IT기술들이 뜻하지 않는 활용을 하는 경우가 의외로 많은 듯 하다. 아직 발견되지 않은 신박한 활용을 상상하니 역시 세상은 넓고 할 일은 많다.

 


2016.6.11
MIT tech review Can You Really Spot Cancer Through a Search Engine? June 8, 2016

 


[1] https://news.ycombinator.com/item?id=11858962
[2] 뉴욕타임즈 Microsoft Finds Cancer Clues in Search Queries JUNE 7, 2016
[3] John Paparrizos, Ryen W. White, Eric Horvitz (2016) “Screening for Pancreatic Adenocarcinoma Using Signals From Web Search Logs: Feasibility Study and Results”, Journal of Oncology Practice, Published online before print June 7, 2016, doi: 10.1200/JOP.2015.010504
[4] 내 백과사전 자연어 처리를 통한 암 연구 2016년 4월 30일

답글 남기기

아래 항목을 채우거나 오른쪽 아이콘 중 하나를 클릭하여 로그 인 하세요:

WordPress.com 로고

WordPress.com의 계정을 사용하여 댓글을 남깁니다. 로그아웃 / 변경 )

Twitter 사진

Twitter의 계정을 사용하여 댓글을 남깁니다. 로그아웃 / 변경 )

Facebook 사진

Facebook의 계정을 사용하여 댓글을 남깁니다. 로그아웃 / 변경 )

Google+ photo

Google+의 계정을 사용하여 댓글을 남깁니다. 로그아웃 / 변경 )

%s에 연결하는 중