GAN과 이더리움을 이용한 애니 캐릭터 생성과 거래 : Crypko

ERC는 Ethereum Request for Comments의 약자로, 이더리움의 발전과 방향에 대해서 이더리움 커뮤니티에 제안하는 기술표준이라고 한다. 제안된 순서로 번호가 붙는데, 그 중 20번 제안이 가장 유명한 것 같다. ERC-20은 블록체인 내 스마트 계약의 프로토콜을 설정하는 이야기 같다. 뭐 본인도 여기까지밖에 모른다-_-

ERC-721은 이더리움 네트워크상에서 복제, 위변조 불가능한 토큰을 설정하는 제안이라고 하는데, 확실치는 않지만 작년에 이더리움 네트워크에 채택된 듯 하다. 아무래도 일전에 이야기한 SuperRare[1]는 이 ERC-721을 기반으로 사업을 구상한 것 같다.

이더리움 블록체인 상에서 고양이를 사고 팔거나 번식시켜 새로운 고양이를 만드는 CryptoKitties에 대해서도 들어본 적이 있는데, 이 역시 ERC-721을 기반으로 작동한다고 한다. 이 게임이 너무 히트치는 바람에 비싼 것은 10만달러에 거래되는 경우[2]도 있고, 이 게임으로 인해 이더리움 해시파워의 30%가 소모될 정도[3]로 인기가 있다고 한다. 진명황의 집행검에 비하면 껌값인듯 ㅋㅋㅋ

한편, 일전에 이야기한 GAN[4]을 활용하여, 인물 사진뿐만 아니라 애니메이션 캐릭터를 생성하는 연구[5]도 본 적이 있는데, 일본 애들이 이런거 많이 하는 듯. ㅋㅋㅋ 훌륭한 연구다. ㅋㅋㅋ

더구나 이 두 가지를 합쳐서, GAN으로 생성된 애니 캐릭터를 ERC-721 기반으로 거래를 하는 사업 아이디어를 구상하는 사람들이 있는 모양이다. 이름하여 Crypko[6] 라고 한다. 헐-_- 물론 ~ko(~子)는 일본 여성이름에 흔히 붙는 글자다. 홈페이지에서 백서[7]를 다운로드 받아서 여러가지 기술적 정보를 확인할 수 있다. 기본적인 거래 구조는 CryptoKitties와 동일할 듯 하다.

들을 노리는 사업구조이긴한데, 덕들은 단순히 그림체만 보는게 아니고 원소스 멀티유즈 형태로 캐릭터의 성격에 빠져드는 것이므로, 그림만으로 얼마나 어필할 수 있을지 궁금해지는구만.

하룻밤 자고 일어나면 새로운 아이디어가 속출하는 세상이니 정신이 하나도 없구만. ㅋㅋ

.


2018.11.21
소니, 내년 PS4용 블록체인 게임 ‘첫 선’ (blockdaily.com)

.


[1] 내 백과사전 디지털 예술작품을 이더리움을 통해 판매하기 : SuperRare 2018년 9월 13일
[2] cnbc Meet CryptoKitties, the $100,000 digital beanie babies epitomizing the cryptocurrency mania 12:42 PM ET Wed, 6 Dec 2017
[3] 지디넷 과도한 블록체인 기대감 덜어드립니다 2017.12.07.17:49
[4] 내 백과사전 generative adversarial network로 생성한 고해상도 인물 이미지 2017년 10월 28일
[5] Koichi Hamada, et al. “Full-body High-resolution Anime Generation with Progressive Structure-conditional Generative Adversarial Networks”, arXiv:1809.01890 [cs.CV]
[6] https://crypko.ai/#/
[7] Whitepaper pdf 5.9MB (crypko.ai)

구글 홈 간단 사용기

과학기술은 자고로 국경이 없어서, 중국의 짝퉁 기술 카피캣 전략이 먹힐 때가 많았다. 근데 자연어 처리 만큼은 국경을 넘는 것이 쉽지 않아서, 중국의 스마트 스피커 개발에 애로사항이 많다는 기사를 예전에 본 적이 있었는데, 도통 출처가 기억이 안 나네-_- 여하간 구글이 아무리 엄청난 기술기업이라서 다른 건 다 앞서갈 수 있어도, 한국어 처리 능력만큼은 엄청난 우위에 있지는 않을 듯 하다. 다만, 한국어 음성인식만큼은 초창기부터 선보였으니 꽤 앞서있을 듯 하긴 하다. ㅋ

오늘 구글 홈 한국 정발 물건을 받아서 잠시 소감을 써봄. ㅋ 원래 한국어 어시스턴트가 똥같은 남자 목소리였기 때문에-_- 안 사려고 했는데, 걍 일본어로 쓰면 될 것 같고 성능도 궁금해서 사봤음. ㅋㅋㅋ 참고로 일본어 구글 어시스턴트는 여자 목소리로 나온다. ㅋㅋㅋㅋ

아답터가 놀랍게도 16.5V 2A (외경/내경 3mm/1mm 정도)였는데, 여러가지 노트북/모니터 등등을 봐 왔지만 이런 요상한 볼트수를 쓰는 가전제품을 본 적이 없다. 아마존 에코[1]는 15V를 쓰기 때문에 아답터가 고장나거나 마음에 안들면 간단히 대체품[2]을 찾을 수 있지만, 이건 아답터 고장나면 답이 없을 듯. 뭐 아답터가 쉽게 고장날 물건은 아니지만, 오래써서 죽는 아답터를 세 번 정도 본 적이 있다. ㅎ

가장 실망한 부분은 hotword의 인식능력이었는데, 일단 아마존 에코에 비해서 현저하게 인식력이 떨어진다. 에코는 스피커에서 뉴스가 나오든 음악이 나오든 ‘알렉사’라는 단어는 귀신같이 알아듣는데-_- 구글 홈은 뉴스가 나올 때 hotword를 초 못 알아 듣는다. 와. 이럴수가. 이걸 이렇게 써 본 사람이 하나도 없나?? 웨이브[3]보다 더 떨어지는 느낌이다. ‘오케이 구글’에서 한 글자라도 발음이 불명확하면 생깐다-_- 사실 이게 별거 아닌 듯 하지만, 사람의 생활을 풍요롭게 하고자 쓰는 물건인데, 출근하기전에 대충 말해서 날씨 듣고 오늘 뉴스 대충 듣고 나가려는데, 인식 안돼서 번거롭게 사람의 인지를 소모하게 되면 주객전도나 다름이 없다. 본인은 자다가 깨서 눈앞이 잘 안보이는 비몽사몽일 때, 몇 시냐고 물어서 시간을 확인할 때도 있다. 이처럼 생활 속에서 자연스럽게 물흐르듯이 옆에 항상 대기하는 비서처럼 사용해야 한다면, hotword에 강해야 한다고 본다.

여하간 기본적으로는 구글 어시스턴트와 성능이 같으므로, 얼마나 유용할지 구입이전에 확인하고 싶다면 구글 어시스턴트로 확인해보는 것이 좋을 듯 하다. 일전에 본 웨이브의 맥락 인식 기능[4]도 되는 듯.

에코에는 ‘오늘의 화제는?’과 같이, 알아서 불특정 정보나 잡지식, 달력일정 등을 큐레이션 해주는 기믹들이 좀 있는데 그런게 좀 적어서 아쉽다. ㅎ

오직 스피커로서의 소감을 말해보라면, 우퍼가 꽤 세서 음악 듣기에는 좋은데, 이 덕분인지 몰라도 정작 어시스턴트의 목소리가 매우 탁하다.

구글도 사실 아마존이 열어놓은 시장을 따라가는 카피캣의 입장이니만큼 아마존보다 더 나은 모습을 보여야 맞지 않나 싶은데, 아직까지는 아마존 에코에 점수를 더 주고 싶다. 에코 스팟[5]을 써보니, 스마트 스피커가 앞으로 이렇게 변하겠구나 싶은데, 역시나 구글이 또 카피캣을 한다는 기사[6]가 나왔다. 아마 국내 스피커도 따라가지 않을까 싶구만.

.


2018.9.22
wave나 echo에 비해 단어만 던지는 명령들은 굉장히 인식률이 낮다. ‘中止’라고만 말하면 거의 못알아 듣고 ‘中止して’라고 말하면 알아듣는다. 중지, 재생, 다음 등등 이런 게 몇 개 있다. 아무래도 2개 국어를 인식해야되다 보니 이런 오작동을 하는 듯 한데, 좀 아쉬운 부분이다.

.


2018.9.23
갑자기 뉴스를 읽는데 에러난다. 구글 홈이 여태까지 써 본 스마트 스피커 중에서 제일 스트레스 받을 때가 많다. 와 이럴 수가 있나. 사용자 측면에서 봤을 때 구글 홈이 제일 완성도가 떨어진다.

.


[1] 내 백과사전 아마존 에코로 선풍기 음성 제어 ㅋㅋ 2018년 4월 7일
[2] 태영전자 15V 1.5A 정전압 SMPS 직류전원장치 아답터 (auction.co.kr)
[3] 내 백과사전 네이버 wave 사용 소감 2018년 9월 8일
[4] 샐리야, 송혜교 몇 살이야? (youtube 36초)
[5] 내 백과사전 아마존 에코 spot 두 개 사용소감 2018년 9월 4일
[6] 화면 달린 AI 스피커, ‘구글 홈 허브’ 나온다 (bloter.net)

[서평] 카카오 AI 리포트 – 인간과 인공지능을 말하다

카카오 AI 리포트 – 인간과 인공지능을 말하다
카카오 AI 리포트 편집진 (지은이) | 북바이북 | 2018-09-10

.


카카오에서 인공지능을 주제로 발간하는 월간지[1]가 있는 모양인데, 이번에 처음 알았다. 이 월간지에 게재된 글을 모은 책이라고 한다.

여러 명의 저자가 쓴 글들을 모아놓은 책이므로, 다방면에서 AI와 관련된 주제들이 매우 광범위하게 논의되고 잇다. 상당히 기술적인 부분을 설명하는 내용도 있고, 데이터 취급이나 서비스 제공시에 고려해야 할 사항을 논하는 글도 있고, AI의 윤리나 도덕에 대한 글도 있다. 각자 관심분야를 골라 읽으면 될 듯 하다.

어느 정도는 이미 알고 있는 내용이었는데, 상당히 많은 몰랐던 이야기들이 많이 언급되고 있다. 일부 내용은 본 블로그에서도 언급한 적이 있다. 책의 앞부분에서 언급되는 딥 러닝의 역사는 여러 경로[2]로 접할 수 있다.

구글이 딥 러닝으로 안저 영상 판독을 했다는 유명한 2016년의 결과[3]가 책에서 상당히 여러 번(p31, p392, p414, p505) 언급되는데, 확실히 임팩트 있는 결과이긴 하지만, 이 결과가 재현 안된다는 주장[4]도 있다는 점을 독서하실 때 참고하기 바란다.
p95에 딥 러닝을 fooling 하는 이야기가 나오는데, 본 블로그에서도 언급한 적[5]이 있다.
p114에 기계학습 모델링으로 주가 예측하는 이야기가 나오는데, 글에서도 주석으로 언급하지만 Knight Capital이 자동매매 오류로 40분동안 4억달러의 손실을 본 사건[6]은 유명하다. 잘 벌다가도 날리는 건 한순간이 아닌가-_- 싶다. 갑자기 오르비 관리자가 AI로 자동 주식 매매를 하고 있다는 이야기[7]가 생각나는구만-_-
p166에 알파고 제로에 대한 네이쳐 논문[8]을 설명하는 글이 나오는데, 일전에도 이야기[9] 했지만 여전히 모르겠다-_-
p189부터 음성인식 인터페이스의 장점에 대한 글이 나오는데, 일전에 읽은 이코노미스트지의 기사[10]와 매우 유사한 느낌이다. 참고하면 좋을 듯 싶다.

한 가지 불편한 점이 있다면, 종이책이라서 뒤쪽 참고문헌에 제시된 url을 일일이 손으로 타이핑해서 들어가야 하는 불편함이 있는데, 전자책으로 나오면 나름 불편함이 해소되지 않을까 싶다.

정보통신기술진흥센터에서 발간하는 ‘주간기술동향’[11]을 관심있게 본다면, 스타일이 비슷하므로 재미있게 읽을 수 있다. 나름 재미있었음. ㅋ

.


[1] 카카오 AI리포트 2017 모음집 (brunch.co.kr)
[2] 내 백과사전 딥 러닝의 간략한 역사와 연구 동향 2016년 4월 20일
[3] Varun Gulshan, Lily Peng, Marc Coram, et al, “Development and Validation of a Deep Learning Algorithm for Detection of Diabetic Retinopathy in Retinal Fundus Photographs” (December 13, 2016) JAMA. 2016;316(22):2402-2410. doi:10.1001/jama.2016.17216
[4] Mike Voets, Kajsa Møllersen, Lars Ailo Bongo, “Replication study: Development and validation of deep learning algorithm for detection of diabetic retinopathy in retinal fundus photographs”, arXiv:1803.04337 [cs.CV]
[5] 내 백과사전 1픽셀로 deep neural network를 무력화 하기 2017년 10월 31일
[6] 뉴욕타임즈 Knight Capital Says Trading Glitch Cost It $440 Million AUGUST 2, 2012 9:07 AM
[7] 오르비는 무엇을 하는 회사인가 (orbi.kr)
[8] David Silver et al. “Mastering the game of Go without human knowledge”, Nature volume 550, pages 354–359 (19 October 2017) doi:10.1038/nature24270
[9] 내 백과사전 AlphaGo Zero의 원리를 한 장의 이미지로 설명하기 2018년 2월 26일
[10] 이코노미스트 How voice technology is transforming computing Jan 7th 2017
[11] 주간기술동향 (itfind.or.kr)

자연어 처리로 Voynich manuscript를 해독하기

갑자기 미야자키 이치사다 선생의 말[1]이 생각나는데, 고문서 해독은 당대의 언어와 문화 전반에 걸쳐 두루 꿰고 있지 않으면 불가능하다. 샹폴리옹이 고대 이집트 신성문자를 해독하는 과정에서 얼마나 많은 개고생-_-을 했는지, 일전에 읽은 Roy와 Lesley의 책[2]에 잘 나와 있다.

미해독된 고대 필사본들 가운데 가장 악명이 높은 것이 Voynich manuscript인데, 많이들 들어보셨을 터이다. 현재까지 해독이 되지 않고 있는 문서인데, 위키피디아를 보니 양피지의 방사선 탄소연대 측정으로 대략 15세기 초에 제작된 것으로 추정된다고 한다.

이 악명높은 고문서를 자연어 처리 기법으로 뚫어보려는 시도[3]가 있었는 듯 하다. 2016년 논문이라 좀 오래 됐는데, 나는 방금 봤으므로-_- 걍 포스팅 함. ㅋㅋㅋ

Alberta 대학 소속의 자연어 처리 연구자인 Greg Kondrak 선생이 Voynich manuscript를 해독하려고 시도한 모양인데, 무료로 논문을 볼 수 있다. 논문 앞쪽[3;p77]에는 암호해독의 정석 중의 정석인 frequency attack과 문자들 사이의 이산 거리 확률을 비교하는 시도를 한 듯 한데, 이렇게 오랫동안 해독되지 않은 문서에 그런 흔한 방법이 통할런지 의문이다. ㅎ

여하간 캐릭터 빈도 분석과 anagram 분석을 이용해서 통계적인 자연어 처리 방식으로 어느 언어인지 맞추기를 시도한 듯 한데, 세계 인권 선언에 들어 있는 380개 언어들과 비교한 결과 히브리 어일 가능성이 높다고 결론을 내린 듯 하다. 근데 위키피디아를 보니 유대인 매거진인 Mosaic에서 그럴리 없다고 주장[4]하는 듯. ㅋ 논문의 몇몇 가정이 매우 의심스럽다고 말하는 듯 한데, 뭐 본인은 히브리 어는 전혀 모르니 넘어갑시다. ㅋ

여하간 내가 보기에는 아무리 통계적 접근을 했다지만, 그 기반은 매우 잘 알려진 고전적 암호해독 기법인데, 히브리 어가 정말 정답이라면 과거 누군가는 히브리 어로 해독을 시도해 이미 풀렸을 가능성이 높을 듯 하다. 역시 고문서를 해독하기 위해서는 당대의 문화와 배경을 연결해야 가능하지, 문자만으로는 곤란하다고 본다. 문외한이 보기에도 꽤나 회의적인 결과가 아닐 수 없다. ㅎ

.


2018.9.15
voynich manuscript 보이니치 필사본 (jayhoonie.tistory.com)

.


[1] 오늘의 한마디(宮崎市定) (sonnet.egloos.com)
[2] 내 백과사전 [서평] 문자를 향한 열정 : 세계 최초로 로제타석을 해독한 샹폴리옹 이야기 2012년 7월 14일
[3] Hauer, B., & Kondrak, G. (2016). Decoding Anagrammed Texts Written in an Unknown Language and Script. Transactions Of The Association For Computational Linguistics, 4, 75-86. Retrieved from https://transacl.org/ojs/index.php/tacl/article/view/821
[4] Mosaic No, the Mysterious Voynich Manuscript Is Not Written in Hebrew FEB. 7 2018

네이버 wave 사용 소감

유튜브에서 스마트 스피커 사용 영상을 수 백개 본 것 같은데-_- 네이버 wave의 맥락 이해 영상[1]에 매료되어 이리 저리 검색을 해 봤다. 본인이 듣는 음악은 국내에서 정식 발매될 확률이 예나 지금이나 거의 없기 때문에 ㅋㅋㅋㅋ 네이버 뮤직을 강매하지 않는 구입처를 검색해보니 비교적 싸게 구입할 방법[2]이 있어서 대충 샀다. ㅋㅋㅋ

모양이 conical frustum인데, 뭔가 쓸데없이 트루를의 전자시인[3]을 연상케 한다. ㅋ 외부가 천으로 덮여 있어 뭔가 고급스런 느낌이 난다. ㅎㅎㅎ

아답터는 12V 2.1A이지만 독특하게도 5V 2A 출력도 겸하고 있고, 일반 usb충전기와 같은 usb type A female 커넥터를 가지고 있어서 휴대폰 충전도 가능할 듯 싶다. 외경/내경은 자로 재 보니 5mm/3mm 정도? 굳이 wave를 끄고, 충전기를 분리한 후 휴대폰 충전을 할 사람도 없을 듯 한데, 왜 이딴 기능을 만든거지? 라고 생각했는데, 자세히 보니 wave가 내장 배터리를 가지고 있었다. 헐…..-_- 이렇게 큰 물건을 들고 다니면서 쓰는 사람이 왜 있다고 생각한 거지-_- 국산 스마트 스피커 중에서 내장 배터리 달고 있는게 좀 있던데, 유심으로 LTE 연결이 가능한 것이 아닌 이상, 인터넷이 연결되지 않으니 IoT 등의 서비스도 의미 없고, 이동할 때마다 매번 핫스팟이나 공용 와이파이 연결하면서 쓸 사람이 얼마나 될런지 의문이다. 여하간 스마트 스피커는 웨어러블처럼 몸에 붙어서 항시 쓰는 타입이 아니라면 배터리는 무조건 에러다. ㅋ

클로바 앱[4]의 설명에는 hotword가 ‘클로바’로 돼 있는데, 정작 hotword는 ‘샐리야’다. 정작 ‘넌 누구니’라고 물으면 클로바라고 대답한다. ㅋㅋㅋ 이거 한 번 사용해 본 사람도 없나. 초 허술하다-_- 앱으로 접속하니 스피커 내부 소프트웨어를 업그레이드 하라고 하는데, 아무리 해도 안 돼서 스피커를 껏다 켜니 비로소 업그레이드가 된다. 한편 안드로이드 클로바 앱[4]은 전화/주소록/문자의 퍼미션을 허용하지 않으면 실행조차 불가능하다. 이 쉐이들 쓸데없이 퍼미션 요구하는 앱의 위험성[5]을 모르는구만. 열받지만 이미 산 걸 어쩔 수 없으니 일단 퍼미션을 줬음.

첫 인상은 별로 좋지 않았지만, 이런 저런 (제작자가 의도치 않을 만한) 초 쓸데없는 대화를 던져보면 (오줌 마려 등..-_-), amazon echo[6]보다 뭔가 조금 더 우월하다. ㅎㅎㅎ 게다가 대화가 더 이어질 듯 하면 하단에 파란 불이 켜지는데, 이 상태에서는 hotword를 말하지 않아도 된다. 이게 쓸데없이 신경쓰일 때도 있긴 한데, 여하간 진짜 뭔가 대화할 수 있는 대상과 대화한다는 느낌을 준다는 점에서, amazon echo보다 더 점수를 주고 싶다. 개발자 분들 대단합니다. ㅎㅎㅎ

hotword의 감도는 amazon echo보다 좀 떨어진다. 특히 소음이 많을 때 echo가 강하다. 정확히 동일한 음악을 동일한 거리에서 echo에서 재생할 때 ‘클로바’(default hotword를 바꿨음)는 못알아 듣지만, 클로바에서 재생할 때 echo는 ‘알렉사’를 알아 듣는다. 맥락이해[1]와 같이 이 부분은 기술적 레벨의 차이가 있다.

오직 블루투스 스피커로서의 성능을 말해보라면, 아마존 에코 plus는 우퍼가 더 강하긴 해도, 개인적으로는 고음을 더 선호하므로 wave쪽의 소리가 더 좋았다. 시중의 xx미니 등의 저가 스피커의 못 들어줄 성능보다는 확실히 블루투스 스피커로서의 강점은 있을 듯.

사무실에서는 일본어를 할 줄 아는 사람이 아무도 없기 때문에 ㅋㅋㅋㅋ 사무실에서 안심하고-_- 아마존 에코 spot[7]을 쓰고 있지만, 이건 아무래도 공개된 장소에는 못 쓸 것 같다. 방에서만 쓰고 있다.

11일에 구글 홈이 국내에 정발된다[8]고 하는데, 성능은 구글 홈 쪽이 더 우월하지 않을까 하고 개인적으로 짐작은 한다. 근데 구글 홈이 구글 어시스턴트처럼 남자 목소리를 계속 고수할 생각이라면 절대 안 살 생각임. ㅋ 일본 구글 어시스턴트는 여자 목소리라서 산다면 언어설정을 일본어로 할 생각임-_-

.


2018.9.8
wave와 휴대폰이 블루투스로 페어링된 상황에서, wave에 뉴스를 재생시키면 블루투스가 끊어지는 현상 있음.

.


2018.9.12
디폴트 뉴스는 YTN이외에 변경이 불가능한 듯 하다. 에코와 달리 라디오용이 아니라 TV용을 들려주는 듯 한데, 가끔 화면을 봐야 이해가 될 듯한 내용이 나오기도 한다.

알렉사보다 hotword의 감도가 좀 떨어져서, ‘클로바’ 한 번에 반응을 안해서 큰 소리로 다시 불러야 반응을 할 때가 종종 있다. 뉴스나 노래가 재생되는 동안에 hotword의 감도가 매우 떨어진다. hotword의 감도가 좋은 아마존 에코와 상당히 비교되는 능력이다.

네이버 클로바 앱[4]에서 하단 ‘디바이스’항목을 선택하면 기기의 상태를 볼 수 있는데, 너무 자주 연결이 끊어진다. 거의 항상 연결이 끊어진 상태임.
‘확장 서비스 관리’가 아마존 에코의 ‘스킬’과 동등한 기능 같은데, 아마존 에코와 비교하면 안습할 정도로 개수가 적다. 뭐 이건 앞으로 차차 늘겠지….

위키피디아 항목에 있는 지식을 물으면 아마존 에코보다 대답을 잘 한다. 지식과 정보 전달의 측면에서는 에코보다 좀 나은 듯. 근데, 이건 구글 어시스턴트가 더 잘한다-_-

.


2018.9.14
공유기 보안 업데이트를 제외하면, 방에 공유기를 끄지않고 계속 켜 놓는다. 아마존 에코는 구입 이래로 한 번도 wifi가 끊긴 적이 없었는데, wave는 이유없이 wifi 접속이 끊긴다. 산 지 일주일 밖에 안 됐는데, 지금까지 두 번 끊겼다. 물론 껐다 켜면 재접속되긴 하지만, 편하려고 산 기계가 사람의 손이 가도록 만든다는 것이 말이 안 된다. 네이버 측은 접속 문제를 해결할 필요가 있을 듯.

.


2018.9.22
잘 안 쓰이는 거 빼고, 자주 등장하는 사자성어를 여러 개 물어봤는데, 구글 홈은 엄청 잘 대답한다. 다만 ‘지록위마’는 자꾸 일본어로 인식해서 실패다. ㅋ 근데 웨이브는 사자성어 대부분을 실패한다. 이거이거 좀 분발해야 할 듯. ㅎ

.


2018.10.1
갑자기 hotword를 전혀 인식 못한다든지, 뉴스를 아예 읽지 않는 다든지 하는 자잘한 오작동이 많다. 편하자고 산 물건에 스트레스 받는 것은 좀 아이러니.

.


2018.10.5
hotword에 전혀 반응을 안 하는 상황이 또 발생했다. 아무리 가까이서 또렷하게 불러도 반응을 안 한다. 재부팅하면 되긴 하지만, 물건을 이런 식으로 만드나 싶어서 답답하구만.

.


[1] 샐리야, 송혜교 몇 살이야? (youtube 36초)
[2] 클로바 웨이브 (smartstore.naver.com)
[3] 내 백과사전 트루를의 전자시인 2011년 7월 13일
[4] 네이버 클로바 – NAVER Clova (google appstore)
[5] 내 백과사전 셰프 쥬디 : 안드로이드 멀웨어 앱의 대규모 확산 2017년 5월 31일
[6] 내 백과사전 아마존 에코로 선풍기 음성 제어 ㅋㅋ 2018년 4월 7일
[7] 내 백과사전 아마존 에코 spot 두 개 사용소감 2018년 9월 4일
[8] 연합뉴스 구글, AI스피커 ‘구글홈’ 11일 국내 선보인다 2018/09/04 14:27

아마존 에코 spot 두 개 사용소감

배송대행이 일을 x같이 처리하는 바람에, 돈 떼먹힌 줄 알고-_- 다른 배송대행에 같은 물건을 다시 주문해서 받았다. 처음 배송대행에 항의하다 지쳐서 그냥 처음 물건을 받았다. (사연이 길지만 본문과 무관하므로 생략) 이런 사유로 졸지에 아마존 echo spot이 두 개가 되었다-_-

여하간 spot을 방에 한 개, 사무실에 한 개 두고 쓰고 있다. 일전에 산 echo plus[1]는 방의 오른쪽에, spot은 방의 왼쪽에 두고 쓰고 있다. ‘알렉사’라 부르면 둘 다 반응하는데, 신박하게도 대답은 둘 중 가까이 있는 놈이 한다. 아무래도 거리를 고려하여 하나가 대답하면 다른 하나는 침묵하도록 멀티 디바이스에 대한 고려가 돼 있는 듯.

재미있게도 spot에다가 部屋をつけて라고 말하면, plus에서 zigbee 신호를 날려준다! 그래서 일전에 구입한 필립스 휴[2]가 켜진다. ㅎㅎㅎ 멀티 디바이스에 대한 고려를 꽤 잘해둔 듯 하다. 당연히 밝기를 30%로 해달라, 색상을 파란색으로 해달라는 명령도 다 된다.

spot은 plus와 마찬가지로 일본식 돼지코 15V 아답터(1.25A)를 쓰긴하는데, 아답터의 겉모습은 똑같지만 아답터의 내경/외경(4mm/2mm정도?)이 조금 달라서 서로 아답터 호환이 안 된다-_- 이거 왜 이렇게 만든거지?? 순정 아답터는 머리가 너무 커서 멀티탭에 쓰기에는 불편하므로, 15V짜리 아답터를 별도로 구입[3]해서 plus에 쓰고 있다. ㅋ

spot은 스크린이 붙어 있어서, 정보를 소리로만 확인하는 것 보다 확실히 낫다고 생각한다. 앞으로 스마트 스피커는 화면이 달려서 나올 가능성이 높아 보인다. 독특하게도 원형인데, 보통 영상들이 사각형인걸 감안하면 영상 시청용으로는 적절치 못할 듯.

NHK 뉴스는 spot용과 plus용이 따로 준비되어 있는 것 같다. 아무래도 plus용은 라디오 뉴스용으로 준비된 것을 내보내는 것 같고, spot용은 텔레비젼 뉴스 용으로 준비된 것을 보내주는 것 같다.

위치설정을 한국으로 지정하면 디폴트 날씨가 안 된다. 근데 서울 날씨를 알려달라고 물으면 또 알려준다-_- 뭐하는 건지… ㅋ

상단에 카메라가 달려 있는데, 写真を取って라고 말하면 사진을 찍어서, 자신의 아마존 계정에 연결된 클라우드에 올려준다. 근데 이걸로 사진찍을 사람이 얼마나 될런지 의문이구만. ㅋ spot의 배경 이미지도 이쪽에 올라가므로, 다른 spot에서도 배경이미지를 동일하게 쓸 수 있다.

가장 기대한 기능이 drop in(呼びかけ)인데, 다른 spot을 통해 영상감시 할 수 있는 기능이라고 한다. 그런데 암만 지역설정을 바꿔봐도 지원하지 않는 지역이라고 나오는데, 이유를 알 수 없다. 그래서 사용은 포기. ㅋ

유튜브로 여러가지 스마트 스피커 사용 리뷰장면을 수백개는 본 것 같은데-_- 구글 홈이 국내에 정발되지 않은 현 시점으로는 네이버 웨이브가 제일 괜찮아 보인다. 특히 맥락이해 기능[4]은 무척 놀랍다. 아마존 에코로 시험해 봤는데, 에코도 못하는 능력이다. 근데 기계 단품으로는 팔지 않고, 네이버 뮤직 자동결제 끼워팔기만 선택해야 하니 괘씸해서 못 사겠다. ㅋ

.


2018.9.7
휴대폰의 언어설정을 일본어로 바꾸니까 비로소 알렉사 앱[5] 하단에 메세지를 보내는 메뉴가 생긴다. 여기서 전화번호를 인증해야 하는데, 한국 전화번호로도 인증이 된다. 이걸 하면 drop in을 쓸 수 있다. 내 계정 앞으로 등록된 디바이스 끼리라서 그런지 몰라도, drop in을 연결하면 휴대폰으로 spot의 화상을 보는게 가능하다. 카메라가 없는 plus로는 소리만 들을 수 있다. 오오 ㅋㅋ 다만 대상 기기가 나이트 모드이면 안 된다. 사무실에서 내 방을 감시할 수 있겠구만. ㅋㅋㅋ

.


[1] 내 백과사전 아마존 에코로 선풍기 음성 제어 ㅋㅋ 2018년 4월 7일
[2] 내 백과사전 필립스 휴 3.0 사용소감 2018년 8월 1일
[3] 태영전자 15V 1.5A 정전압 SMPS 직류전원장치 아답터 (auction.co.kr)
[4] 샐리야, 송혜교 몇 살이야? (youtube 36초)
[5] Amazon Alexa (google playstore)

りんな의 신곡 りんなだよ

일본 마이크로소프트의 여고생을 표방하는ㅋㅋㅋ 인공지능 りんな 이야기를 일전에 한 적[1]이 있는데, 일본 마이크로소프트에서 りんな의 이름으로 오리지널 음악을 발표했다고 한다.[2] 음원 판매 사이트인 mora에서 고음질 파일을 무료로 배포[3]하고 있지만, mora가 원래 일본내 ip에서만 판매하기 때문에 한국에서는 받을 수 없다. 대신에 유튜브[4]로 뮤직비디오를 볼 수 있다. ㅎ

보컬로이드의 조금 투박한 음악과 비교하면 도저히 computer-generated 라고는 믿기힘들 정도의 자연스러움이다. 어디까지 생성한 것이고 어디서부터 사람이 튜닝한 것인지 불명확하긴 하지만, 기술적 내용에 대해 약간의 정보가 있는 ASCII.jp의 기사[5]가 있다.

코퍼스를 활용한 통계적 음성합성을 사용하고 있고, 소리의 길이/강약/음정/음색 등의 파라미터를 제어하는 모양이다. 내 추측으로는 일전에 이야기한 오토튠[6]에 쓰이는 알고리즘을 이용하지 않을까 싶다. Andy Hildebrand가 오토튠을 만들기 전에는 이런 작업들의 연산량이 엄청나서 불가능하다고 생각했다고 한다. ㅎㅎ

정말 사람이 하나도 손을 안 대고 만든 사운드라면 진짜 놀랍다. 일전에 이야기한 작곡하는 컴퓨터[7]와 합치면, 언젠가 사람의 손을 전혀 거치지 않는 음악이 나올 수도 있을지도 모른다. ㅎㅎㅎ 여하간 음성합성 기술이 날마다 발전하는 모습을 보니 신박함을 금할 수 없구만. 노래 좋다. ㅎㅎㅎ

.


[1] 내 백과사전 りんな : 일본 마이크로소프트 채팅 봇 2016년 9월 15일
[2] ねとらぼ 歌声の進化っぷりがすごい 女子高生AI「りんな」が歌う新曲のハイレゾ音源が無料配信中 2018年08月25日 18時06分
[3] りんなだよ (mora.jp)
[4] [女子高生AIタレント りんな]りんなだよ (youtube 3분 53초)
[5] ASCII.jp 女子高生AIりんな、人間の声帯を模擬した「統計的音声合成」と「耳コピ」で歌唱力を高める 2018年08月01日 10時00分
[6] 내 백과사전 오토튠의 탄생 2017년 10월 18일
[7] 내 백과사전 음악을 작곡하는 컴퓨터 2014년 8월 15일

에드먼드 벨라미의 초상화 Portrait of Edmond de Belamy


오는 10월에는 AI가 그린 회화 한 점이 크리스티스 옥션 하우스에서 출품될 예정이라고 한다.[1,2] 헐. ㅋㅋㅋ 위 이미지는 크리스티스 홈페이지[2]에서 가져왔음. 근데 암만 검색해봐도 회화의 메타정보가 없어서, 무슨 재질로 그린 건지 크기는 얼마인지 알 도리가 없다. 회화 작품 볼 때 왜 메타정보에 관심없는지 도통 모르겠구만. 심지어 크리스티스 홈페이지[2]에도 작품의 사이즈가 안 나와 있다.

원래 낙찰가가 높아야 바이어 프리미엄도 올라가므로 옥션 하우스는 최대한 분위기를 띄울 필요가 있다. ㅋ 참고로 옥션 하우스의 성장에 관한 역사에 대해서는 Joshua Knelman의 [3]에 짧게 언급되어 있다.

만든 단체는 Obvious Art라는 예술가(AI 연구자?) 집단이라고 하는데, 자신들의 홈페이지[4]에 있는 설명에 의하면, 일전에 이야기[5]한 GAN을 이용하여 회화 작품을 창작하는 듯 하다.

AI가 창조한 작품이 팔리는 사례 자체는 처음이 아니라 작년에 Le Comte de Belamy라는 작품이 1만 파운드에 팔린 적이 있는 것 같다.[6] 역시 마찬가지로 Obvious의 작품이고, 홈페이지[4]에서 찾아볼 수 있다. 더 과거에 매매 사례가 있을 수도 있겠지만, 잘 모르겠음…

여하간 내가 보기에는 작품 자체는 뭔가 인상파스러운 느낌이 드는 듯… ㅋㅋ 아무래도 인상파 작품들로 학습을 한 모양이다. 일전[5]에도 놀랐지만, GAN이 그럴듯한 이미지를 만들어 내는데는 탁월한 방법인 것 같다. 범용 AI는 물론 매우 멀었지만, 이런 특수용도의 AI는 앞으로 발전할 여지가 많을 듯 하다.

우측하단에 서명 대신에 다음과 같은 식이 적혀 있다고 한다.

\displaystyle \min_{G} \max_{D}\mathbb{E}_x [\log (D(x))] + \mathbb{E}_z [\log(1-D(G(z)))]

아무래도 GAN의 알고리즘에서 공격하는 측과 방어하는 측의 기대값을 합산한 것을 다루는 미니맥스 전략을 표현한 게 아닐까 싶다. Ian Goodfellow et al.의 논문[7;p3]에 비슷한 식이 있다. ㅎㅎ

여하간 미술계의 색다른 사조가 탄생하는 광경을 목도하는게 아닐까 싶기도 하다. 낙찰가가 궁금해지는구만. ㅎㅎㅎㅎ

.


2018.10.26
지디넷 인공지능이 그린 초상화, 거액에 팔렸다 2018.10.26.10:10

.


2018.11.14
위키피디아 항목이 생겼네. ㅋㅋ 위키피디아 페이지에 메타 정보가 있음.

.


[1] 크리스티 경매에 등장한 인공지능이 그린 초상화 (thegear.co.kr)
[2] Is artificial intelligence set to become art’s next medium? (christies.com)
[3] 내 백과사전 [서평] 사라진 그림들의 인터뷰 – 미술품 도둑과 경찰, 아트 딜러들의 리얼 스토리 2018년 5월 20일
[4] Obvious is a collective of artists, friends an AI reasearchers. (obvious-art.com)
[5] 내 백과사전 generative adversarial network로 생성한 고해상도 인물 이미지 2017년 10월 28일
[6] Why One Collector Bought a Work of Art Made by Artificial Intelligence—and Is Open to Acquiring More (news.artnet.com)
[7] Ian J. Goodfellow, et al. “Generative Adversarial Networks”, arXiv:1406.2661 [stat.ML]

메이커스 매거진 부록 AI Maker Kit​

‘메이커스: 어른의 과학’ 이라는 잡지[1]의 부록으로 DIY 스마트 스피커가 딸려 있다고 해서 재미로 사 봤다. ㅋㅋ 라즈베리 파이까지 합친 버전이 있고 라즈베리 파이가 빠진 버전이 있다. 재생시간 4분 10초.

KT의 스마트 스피커인 ‘기가지니’의 백엔드 서버를 사용하는 것 같다. 조립한 이후에 작동을 위해서는 KT 개발자 홈페이지[2]에 등록을 해야하고, 개인사용자는 하루 500건의 쿼리가 무료로 제공된다. KT가 웬일로 이런 공익적 서비스를 제공하다니 ㅎㅎ 휴대폰 통신사를 KT로 쓰는 보람이 있구만. ㅋㅋㅋ

아무래도 구글의 DIY smart speaker kit[3,4]을 모방한 듯 한데, 어쨌든 사용자가 직접 커스터마이즈 할 수 있다는 매력이 있다. 게다가 한국어로 작동가능하다!!!!! 이게 진짜 엄청난 장점이다. ㅋㅋㅋ

‘메이커스’에 있는 그대로 따라하면 된다. 주의깊게 읽으면 컴맹도 일단은 조립해서 작동은 가능하도록 설명이 친절하게 돼 있다. 드라이버와 예제파일이 모두 포함된 라즈비안 이미지 파일은 KT의 기가지니 개발자 홈페이지[2]에서 받을 수 있다. 참고로 기가지니 개발자 포럼에서 pi3 B+에서는 작동을 안한다고 하는 사람이 있던데, 안전한 pi3 B를 사용하는 것이 좋을 듯 하다.

근데 문제는 라즈비안의 apt-get upgrade를 하는 순간에 내장 스피커가 먹통이 된다-_- 아무래도 버전문제 같은데, 여러모로 용을 써 봤지만 본인의 능력으로는 도저히 수정할 수가 없어서 apt upgrade를 못하고 있다. 드라이버만 별도로 제공[5]하긴 하는데, 이것도 역시 버전문제로 작동이 안 된다. 젠장.. 이것만 되면 메이커스에서 제공하는 킷 없이, 그냥 usb 마이크와 스피커를 연결해서 구현가능할 듯도 하다.

작동 코드는 node js를 쓰던데, 본인이 node js에 대한 지식이 전무해서 코드를 봐도 수정이 안 된다-_- 일단 stt로 입력받은 텍스트를 내가 우선 가공해서, KT 기가지니 DSS 서비스로 넣고 싶은데, 이 간단한 작업을 못 하겠다-_- 좌절이다-_-

KT에서 제공하는 stt의 성능은 그럭저럭인데 tts의 성능은 준수한 듯 하다. 예제파일을 몇 개 실행해 봤는데, 쓸데없이 재미있다. ㅋㅋㅋ

메이커스 킷에 들어있는 보드에는 gpio를 그대로 쓸 수 있도록 옆으로 빼 놓았는데, 여기에 예전에 라즈베리 파이 용으로 사둔 5인치 LCD 모니터[6]를 꼽아 쓸 수 았다. 이 모니터는 라즈베리 파이의 gpio에서 전류를 끌어 쓰기 때문에 별도의 전원 없이도 동작한다. 아주 짧은 hdmi선으로 연결하니 손바닥만한 훌륭한 컴퓨터가 되었다. ㅋㅋㅋㅋ 근데 이 모니터의 터치 기능을 쓰려면 apt upgrade를 해야해서[7] 못 쓰고 있다-_- 이걸 활용해서 한국어 사용이 가능한 아마존의 echo show처럼 멋있는 인공지능 스피커로 만들고 싶은데, node js를 몰라서 좌절 중이다ㅠㅠ

.


2018.8.12
JSON.stringify 라는 함수가 뭔지 이해했다!!!! 음하하하 뭔가 할 수 있을 것 같다. ㅋㅋㅋ

.


2018.8.13
node js가 너무 어렵다. 코드 실행 순서도 모르겠구만-_-

.


2018.8.20
지디넷 “중고생도 2시간이면 AI스피커 개발 가능” 2018.08.19.09:00

.


[1] http://makersmagazine.net/
[2] https://gigagenie.ai/
[3] https://aiyprojects.withgoogle.com/
[4] cnet Google includes a Raspberry Pi in a DIY smart speaker kit APRIL 16, 2018 2:36 PM PDT
[5] ai-makers-kit/driver/ (github.com)
[6] 라즈베리파이 5인치 800×480 HDMI LCD 터치스크린 모니터 [CN0024] (devicemart.co.kr)
[7] 5inch HDMI LCD (waveshare.com)