인공지능과 고양이가 착시를 보는 법

GAN이 인물사진을 생성하는데는 매우 뛰어나다는 연구[1]가 있는데, 그에 반해 착시를 일으키는 이미지를 생성하는 데는 별로 적합하지 않다는 연구[2]를 본 적이 있다.

그에 반해 DNN으로 착시를 이해시키는데 성공했다는 연구[3]도 있던데, 심리학 저널에 실리는 걸 보면 나름 심리학계에서 관심이 있는 듯. PredNet[4]이라는 걸 이용했다고 한다.

이 연구[3]에서 쓰인 착시 이미지는 Rotating Snakes[5]라고 한다. 아마 대부분 한 번쯤 본 적이 있을 듯. PredNet은 비디오의 어느 프레임을 보고 그 다음 프레임이 어떨지를 예측하는 코드인 모양인데, 착시 이미지는 실제로 정지된 이미지이지만 마치 움직이는 것 처럼 보이니까, 이걸 이용해서 DNN도 착시의 움직임을 예측한 듯 하다.


클릭하면 커진다. 모니터 가까이서 이미지의 중심을 주시하면 원이 회전하는 것 처럼 보인다.

위키피디아에 따르면 이 이미지를 만든 사람은 키타오카 아키요시(北岡 明佳)라는 심리학자라고 한다. 일전에 스기하라 코이치 선생의 착시[6]도 본 적이 있는데, 일본인들이 이런 재밌는 걸 많이 하는 듯. ㅎㅎㅎ 일전에 본 색 착시[7]를 소개하는 ねとらぼ 기사[8]가 생각난다.

키타오카 선생은 아까 DNN으로 착시를 학습시키는 연구[3]의 저자 목록에 들어가 있다. 트위터도 하는 모양[9]인데, 보니까 재밌는 트윗이 많구만. ㅋ

Nottingham 대학 심리학과 소속[10]의 Steve Stewart-Williams 선생의 트윗[11]을 보니 이 Rotating Snakes가 고양이에게 통하는 듯 한 영상을 소개하고 있다.

이거 ethology 연구하는 사람은 이미 다 알고 있는 건지는 모르겠는데, 나는 꽤 신박하다. ㅎㅎ 일전에 아이추판다 선생이 색 착시가 주는 이점에 대해 쓴 글[12]이 생각나는데, Rotating Snakes에 의해 발생하는 착시가 생존에 어떤 이점이 있어서 인간과 고양이에게 진화되었는지 궁금해지는구만.

.


[1] 내 백과사전 generative adversarial network로 생성한 고해상도 인물 이미지 2017년 10월 28일
[2] “Optical Illusions Images Dataset”, Robert Max Williams, Roman V. Yampolskiy, (Submitted on 30 Sep 2018 (v1), last revised 16 Oct 2018 (this version, v2)) arXiv:1810.00415 [cs.CV]
[3] Eiji Watanabe, Akiyoshi Kitaoka, Kiwako Sakamoto, Masaki Yasugi, Kenta Tanaka. “Illusory Motion Reproduced by Deep Neural Networks Trained for Prediction”, Frontiers in Psychology, 2018; 9 DOI: 10.3389/fpsyg.2018.00345
[4] PredNet (coxlab.github.io)
[5] Rotating Snakes (illusionsindex.org)
[6] 내 백과사전 스기하라의 원기둥 착시 2016년 10월 10일
[7] 내 백과사전 재미있는 색 착시 2017년 5월 13일
[8] ねとらぼ 青と黒を移動させると白と金……? 見える色が変わるドレスの錯視が再現されたイラストにびっくり 2017年05月11日 20時28分
[9] Akiyoshi Kitaoka (twitter.com)
[10] http://www.stevestewartwilliams.com
[11] https://twitter.com/SteveStuWill/status/1121531513055485952
[12] 합리적 착시(?) (nullmodel.egloos.com)