엑셀 오류가 생물학 연구에 미치는 악영향(2005-2015)

20160910_woc515_0
이코노미스트지의 Daily chart에 흥미로운 차트가 소개[1]되어 있다.

‘엑셀 오류’ 하면 떠오르는게 제작년인가 경제학에 대폭풍을 몰고왔던 라인하르트와 로고프의 그 논문[2]의 오류 사건 (소위 엑셀 불황-_-the Excel Depression)인데, 뭐 워낙 유명해서 경제학에 초 문외한인 본인도 많이 들었다. 뭐 이에 관해서 굉장히 잘 설명하는 글도 대단히 많으니[3,4,5,6] 넘어갑시다. ㅋ

이 작은 엑셀의 오류가 국가의 긴축정책으로 이어져 수많은 사람들의 고통을 낳은 걸 보면, 엑셀 오류라고 만만히 볼 사안은 아닐 것이다. 이코노미스트지에서는 생물학에서 유전자 이름에서 비롯한 엑셀의 오류가 어느정도인지를 조사한 논문[7]을 소개하는 듯 하다. 뭐 대부분의 오류는 논문의 결정적인 영향은 주지 않지만, 협력적 연구나 결과의 재현성에 영향을 줄 가능성이 있다.

원본 논문[7]에는 사례가 몇 개 소개되는데, 예를 들어 SEPT2 라는 유전자는 엑셀에서 9월 2일로 인식될 수 있다. 마찬가지로 MARCH1 이라는 유전자는 3월 1일로 잘못 인식되는 수가 있는 모양이다. 한편 2310009E13라는 유전자는 과학적 표기법으로 잘못 인식하여 2.310009 \times 10^{13}로 인식될 수 있는 모양.

논문의 저자에 따르면, 이런 에러를 포함하는 논문이 해마다 15%씩 증가하고 있다고 한다. 뭐 그래도 생물학에서는 충격적인 결과가 나온다면 재현이 중요할 터이니 ‘엑셀 불황’ 만큼의 파급은 없겠지만… ㅎㅎ

근데 생물학에서 엑셀을 그렇게 많이 다루는 줄 몰랐다. 뭔가 대안이 없는 건지는 잘 모르겠음.

 


[1] 이코노미스트 Excel errors and science papers Sep 7th 2016, 14:23
[2] Reinhart, Carmen M.; Rogoff, Kenneth S. (2010). “Growth in a Time of Debt”. American Economic Review. 100 (2): 573–78. doi:10.1257/aer.100.2.573.
[3] 긴축 정책 기반이 된 로코프-라인하트 논문, 엑셀 실수? in NewsPeppermint
[4] [긴축vs성장 ③] 케네스 로고프-카르멘 라인하트 논문의 오류 by joohyeon
[5] 라인하트-로고프 논문의 치명적 오류: 정부부채 논쟁 by 신봉남
[6] 엑셀발 불황 The Excel Depression – 폴 크루그먼 by Hedgecat
[7] Mark Ziemann, Yotam Eren, Assam El-Osta (2016) “Gene name errors are widespread in the scientific literature”, Genome Biology, 17:177 DOI: 10.1186/s13059-016-1044-7

답글 남기기

아래 항목을 채우거나 오른쪽 아이콘 중 하나를 클릭하여 로그 인 하세요:

WordPress.com 로고

WordPress.com의 계정을 사용하여 댓글을 남깁니다. 로그아웃 / 변경 )

Twitter 사진

Twitter의 계정을 사용하여 댓글을 남깁니다. 로그아웃 / 변경 )

Facebook 사진

Facebook의 계정을 사용하여 댓글을 남깁니다. 로그아웃 / 변경 )

Google+ photo

Google+의 계정을 사용하여 댓글을 남깁니다. 로그아웃 / 변경 )

%s에 연결하는 중