네이버 클로바vs아마존 알렉사vs구글 홈 실사용 평가

유튜브에서 스마트 스피커 비교하는 영상[1,2]이 있던데, 나름 재미있다. 재생시간 6분 10초[1], 6분 50초[2].

유튜브 등에 존재하는 스미트 스피커 리뷰영상들이 상당히 많은데, 실사용을 비교하는 영상보다는 구독자의 모으기를 유도하는 영상이 많아서 아쉽다. 그리하여 본인이 네이버 웨이브[3], 아마존 알렉사[4], 구글 홈[5]을 실사용한 후기를 실제로 써볼 테니 구매에 참조하기 바란다.

사실 컴퓨터의 입출력 장비로는 키보드/마우스보다 음성/터치가 훨씬 자연스럽다. 프로그래머나 작가 등등 특수 직업군의 입장에서는 키보드가 자연스럽지만, 궁극적으로 사람의 의도를 파악하여 자동적으로 입력을 하게 되는 날이 온다면, 음성 입력이나 뇌파 입력이 훨씬 편할 날이 올 것이다. 근데 이런건 초초초 먼 미래일 듯 하다. ㅋㅋㅋㅋ

일단 특수 직업군을 제외한 일반 대중의 관점에서, 미래에는 틀림없이 컴퓨터에게 어떤 지시를 내릴 때, 키보드로 할 가능성 보다는 음성으로 할 가능성이 훨씬 높다고 본다. 실제로 스마트 스피커의 사용자수는 급속히 증가하고 있고[6], 아직 불완전하긴 하지만, 터치 인터페이스가 컴퓨터를 모르는 사람에게도 사용성을 가져왔듯이[7], 궁극적으로는 음성 명령이 일반 대중의 관점에서 컴퓨터 입출력의 대세가 될 것이라고 본다. 먼 과거(?)에 마우스라는 입출력기기가 해커들에게 컴퓨팅 파워의 낭비라고 비난을 받았던 일[8]을 돌이켜보면, 직관적 입출력 인터페이스는 컴퓨터 입출력의 궁극적인 지향임을 느낄 수 있다. 뭐 스마트 스피커가 필요없다고 생각하는 사람은 당연히 필요없다. 스마트폰이 대세가 되어도 피쳐폰으로 만족하는 사람은 언제나 있기 마련이다. ㅋ

여하간 세 개의 스마트 스피커를 수 개월 실사용 했으니, 유튜브의 구독자 구걸을 하는 어중이 떠중이들 보다는 나만큼 실사용에 대해 실용적 평가를 할 수 있는 사람은 드물다고 자부한다. ㅎㅎㅎ

.


//아마존 에코 (본인은 일본어로 설정해서 사용하고 있음.)

다양한 서드 파티의 호환성이 장점이긴 하지만, 그런 장점들은 한국에서 서비스 하고 있지 않으므로 체감하기 힘들다. 이것을 제외해도, 아마존 에코는 음성 인식 그 자체 본연의 성능만으로도 뛰어나다. 예를 들어, 방 안에서 아무 방향을 향해, 술먹은 듯 불명확하게, 힘없이, 대충 アレックサ、部屋をつけて라고 말하면 필립스 휴[9]가 켜진다! 다른 스피커를 써보니 이게 대단한 거다. 사람이 편하자고 쓰는 물건인데, 퇴근한 후에 피곤해 죽겠는데, 스마트 스피커에게 이것 저것 시켜서 말을 안 들어 스트레스를 받으면 완전히 주객전도다.

그리고 아마존 에코는 시기에 따라 적절한 컨텐츠를 항상 제공한다. 예를 들어 연말이 되면 크리스마스에 대한 알렉사 오리지널 스토리를 제공하고, 칠석이 되면 칠석과 관련된 이야기가 새로 준비 되어 있으니 사용해보라는 메시지를 준다. 또한 월드컵이 되면, 월드컵에 맞는 컨텐츠를 제공한다. 즉, 계절에 맞는 컨텐츠를 지속적으로 제공해서 사용을 유도한다. 확실히 디바이스 사업은 컨텐츠를 동반하지 않으면 성공하기 어렵다는 걸 실감한다. 아이폰도 앱스토어가 없으면 절대 성공 못했을 거라고 장담한다.

본인은 에코 중에서 가장 비싼 모델인 에코 플러스를 쓰고 있는데, 가장 비싼 물건이라 그런지 블루투스 스피커로서는 최고의 성능이다. 나름 블루투스 스피커/헤드셋을 많이 사봤다고 자부하는데(돈도 많이 날렸다-_-) 블루투스 버전이 올라가면서 요새는 끊김이나 기기 상성 같은게 많이 덜해졌지만, 그래도 은근 남아있다. 블루투스 스피커로서 각종 상황(물건을 가린다든지 빠르게 움직인다든지 등)에도 안 끊기고, 멀티 디바이스 지원하고, 편의성이 있으면 거의 최고급이라 말할 수 있다. ㅎㅎㅎ

근래에 일본에서 에코 쇼가 출시 됐길래 유튜브로 실 사용 영상을 꽤 많이 봤는데, 확실히 비주얼 인터페이스를 가지고 있으니 나름 사용성이 낫다. 향후 스마트 스피커는 이쪽 방향으로 가지 않을까 싶다.

//네이버 웨이브

본인은 네이버 클로바의 다양한 라인업 중에서 conical frustum 모양의 웨이브를 가지고 있다. 외양은 제일 멋있는데-_- 성능은 아마존 에코보다 한 수 아래인 듯 하다. ㅋ 구매 초기에는 사소한 오작동이 있었는데, 업데이트 이후에는 없어졌다.

하지만 음성 인식력이 가장 떨어진다. 아마존 에코나 구글 홈은 방안에서 아무 방향이나 말해도 거의 알아듣는데, 클로바는 반드시 스피커를 향해서 일정 크기의 힘을 줘서 말해야 알아 듣는다. 이게 나름 꽤 귀찮은데, 아마존 에코나 구글 홈에서 아무 방향을 향해 아무렇게나 말해도 인식하고 작동한다는 메리트가 대단히 크다. 아마 오작동에 대한 비난을 피하고자 마이크의 감도를 낮춘게 아닐까 싶긴 한데, 실제로 써보면 불러도 대답없고, 그래서 또 불러야 되는 행위 자체가 되게 불편하다.

블루투스 스피커로서의 성능으로는 조금 불만이 있다. 은근히 소소한 끊김이 있어서 음악 감상에 훼방이 된다. 그리고 음악이 나오지 않고 블루투스만 연결된 상태에서 뉴스를 읽어 달라고 하면, 블루투스 연결이 꾾긴다. 이유는 모르겠음. 여하간 꽝이다. 그리고 이퀄라이저 설정이 없다.

한국어로 사용가능하다는 것은 최고의 장점이다. ㅎㅎㅎㅎ 나름 스마트 허브의 기능을 제공하고 있어서 mBox[10]를 활용하면 적외선 리모컨 기기까지 사용 가능하다. 직류전압 아답터가 작아서 머리가 큰 에코나, 구글 홈 보다 멀티탭에 꽂기 용이하다. 이게 (네이버 웨이브의 장점은 아닐지 몰라도 여하간) 나름 대단한 장점임. ㅋ

//구글 홈 (본인은 일본어로 설정해서 사용하고 있음.)

한국어로 설정하면 똥같은 남자 목소리가 나와서-_- 여자 목소리가 나오는 일본어로 쓰고 있다. ㅋㅋㅋㅋ 크롬캐스트를 말로 제어할 수 있는 건 마음에 든다. 근데, 크롬캐스트로 추천하는 유튜브 영상을 틀어보라고 시키면 성능이 너무 똥이다-_- 분명히 내가 다운보트 누른 영상인데, 계속 나온다. 이건 스피커의 능력인지, 구글의 능력인지 여하간 초 멍청함.

블루투스 스피커로서는 완전 꽝인데, 왜냐하면 블루투스 스피커의 볼륨이 스피커 자체의 볼륨과 연동된다. (극초창기 안드로이드도 이랬음) 그래서 음악의 볼륨을 올리면 다른 컨텐츠의 볼륨도 올라가는데, 이거 여간 불편한게 아닐 수 없다. 이거 실제로 써 본 사람도 없나??? 그리고 저음이 지나치게 강해서, 이퀄라이저 설정에서 베이스 볼륨만 최소로 낮추어 쓰고 있다. 이게 음악 들을 때는 괜찮은데, 뉴스라든지 사람의 목소리를 들을 때는 소리가 탁해서 불편하다.

그리고 구글홈 홍보에 2개국어 기능을 강조하던데, 실제로 2개국어 써보면 오인식이 많아서 열라 불편하다. 이건 좀 이해해 줄 수 있는 부분인데, 아무래도 한/일/중 3개 언어권은 한자어가 발음이 비슷한 게 많아서 그렇긴 한데, 여하간 결국 단어만 말하면 오작동을 일으킨다. 예를 들어, 네이버 클로바나 아마존 에코는 단어만 말하면(날씨) 알아 듣는데, 구글 홈을 2개 국어로 설정할 경우 문장까지 통째로 말해야 (날씨 알려줘) 비로소 알아 듣는다. 사람이 편하자고 쓰는 건데 이런 건 주객전도다. 그래서 처음에 일/한 2개국어로 쓰다가 나중에는 일본어로만 쓰게 됐다. 그리고 구글의 명성 답지 않게, 다른 스피커들에 비해 은근 오작동이 많다.

언어를 일본어로 설정해도, 뉴스에서 Reuters나 한국의 YTN 등 해외 언론이 재생가능한 것은 꽤 장점이다. 일본 아마존 에코는 아마 미국 아마존과 분리된 스킬 마켓을 가지고 있는 듯한데, 해외 언론 매체는 재생이 되지 않는다.

마지막으로 다른 스피커와는 다르게 아답터가 16.5V로 흔하지 않은 전압을 쓴다. 에코는 15V, 웨이브는 12V로서 상대적으로 구하기 쉽다. 만악 아답터가 고장나면 곤란해진다. 뭐 사실 가만히 세워 놓고 쓰는 물건이라서 고장날 일은 거의 없을 듯 하긴 하다. ㅋ 아답터가 너무 커서 멀티탭에 꽂기가 불편하다. 에코도 머리가 엄청나게 크다. 아답터 크기의 편의성은 웨이브가 제일 낫다.

.


주변 iot 기기 제어를 제외하면, 오래 쓰다보면 결국 스마트 스피커에게 날씨와 뉴스를 묻는 게 사용의 전부가 되는 듯 하다. 결국 사용자가 특정한 것을 원하여, 그러한 기능을 인지하여 불러내는 기능을 가지는 스피커들 보다는, 알아서 스케줄에서 어떤 일정이 예정되어 있고, 오늘은 역사 속의 어떤 사건이 있었던 날이며, 이러한 이벤트를 이용해 보시라고 권하는 아마존 에코가 종합적 측면에서 여러모로 가장 뛰어나다고 생각한다. 전자제품의 초창기는 플랫폼이 중요하지만, 대중성을 확보하려면 컨텐츠가 더 중요하다는 반복되는 진리를 다시 확인해 보는 것이라고나 할까.

.


2019.1.2
술 깨고 보니 내가 이런 글을 썼네-_- 왜 썼지… 삭제하고 싶지만, 뭐 놔둬도 상관없나. ㅎ

.


[1] 구글홈vs카카오미니vs클로바 퀴즈 대결! 과연 1위는? ‘전국 AI스피커 자랑’ 1탄 (주리를틀어라) (youtube 6분 10초)
[2] 구글홈vs카카오미니vs클로바 중 반응속도가 가장 빠른 스피커는? AI스피커 퀴즈 대결 2탄 (주리를틀어라) (youtube 6분 50초)
[3] 내 백과사전 네이버 wave 사용 소감 2018년 9월 8일
[4] 내 백과사전 아마존 에코로 선풍기 음성 제어 ㅋㅋ 2018년 4월 7일
[5] 내 백과사전 구글 홈 간단 사용기 2018년 9월 21일
[6] 포브스 Smart Speaker Users Growing 48% Annually, To Hit 90M In USA This Year May 29, 2018, 04:56pm
[7] 내 백과사전 아이패드의 직관적 인터페이스 2011년 11월 19일
[8] 내 백과사전 [서평] FREE 프리 : 비트 경제와 공짜 가격이 만드는 혁명적 미래 2010년 6월 3일
[9] 내 백과사전 필립스 휴 3.0 사용소감 2018년 8월 1일
[10] 내 백과사전 mBox : 음성으로 적외선 리모컨 신호 제어 2018년 12월 8일

콴타 매거진 선정 2018 수학/컴퓨터 과학 주요 사건들

콴타 매거진에서 2018년에 있었던 수학 및 컴퓨터 과학 주요 사건들을 되짚어보는 기사[1]를 봤는데, 자꾸 나이 어린 사람들의 업적을 강조하네. 사실 30세 필즈메달 수상자[2]도 나오고, 아티야 선생은 노망-_-났으니[3], 기사[1]대로 젋은이의 해가 맞긴 맞나 보다.

기사[1]에서 언급한 양자 컴퓨터 관련 사건은 무슨 말인지 모르겠으니 넘어가고-_- 내가 보기에는 Scholze 선생이 모치즈키의 증명에 딴지를 건 사건[4]이 좀 큰게 아닌가 싶다. 그 딴지가 아니더라도 지금까지의 모치즈키 선생의 행동이 증명으로 인정받기에는 부족함이 많다[5]는건 확실하다. 이거 어떻게 돌아가고 있는지 모르겠네…

기사[1]에서 세 번째로 언급하고 있는 이야기가 인공지능을 fooling하는 내용인데, 컴퓨터에게 주어진 이미지 내의 사물 인식을 시킬 때, 이미지 내에 코끼리 그림을 넣는 사소한 수정만으로 주변 사물 인식이 크게 실패한다는 이야기[6] 같다. 이런 연구도 있는 줄은 오늘 첨 알았네. ㅎㅎ 일전에 이야기한 1픽셀 fooling[7]이 생각나는 대목이다. 참고로 영문법에서 Elephant in the Room이란, 누구나 그 존재를 알고 있으나 모든 이가 그 존재를 무시하거나 언급을 꺼리는 상황을 가리키는 idiom임.

기사[1]에서 다섯 번째로 Goldfeld conjecture를 풀었다는 이야기가 나오는데, 뭔 문제인지는 잘 모르겠음..ㅠㅠ 타원 곡선의 분류 문제인 듯 함. 하바드 대학원생이 풀었다고 하는데, 대학원생이 40년짜리 오픈 문제 풀었으니 흔한 사건은 아닌 듯 하다. ㅎㅎㅎ

기사[1]에서 마지막으로 언급하는 이야기가 그 하루히 문제[8]-_-다. 본 블로그에서 나름 자세히 다루었으니 ㅋㅋㅋㅋ 참고하시라. ㅋㅋㅋ 콴타 매거진에서도 기사[9]로도 나와 있다.

.


[1] 콴타 매거진 The Year in Math and Computer Science December 21, 2018
[2] 내 백과사전 30세 필즈 메달 수상자 2018년 8월 2일
[3] 내 백과사전 Atiyah 선생의 리만 가설 증명? 2018년 9월 21일
[4] 콴타 매거진 Titans of Mathematics Clash Over Epic Proof of ABC Conjecture September 20, 2018
[5] 내 백과사전 모치즈키의 abc 추측 증명에 대한 논란 2017년 12월 22일
[6] Amir Rosenfeld, Richard Zemel, John K. Tsotsos, “The Elephant in the Room”, arXiv:1808.03305 [cs.CV]
[7] 내 백과사전 1픽셀로 deep neural network를 무력화 하기 2017년 10월 31일
[8] 내 백과사전 하루히 문제 : Superpermutation의 최소 길이 2018년 11월 2일
[9] 콴타 매거진 Mystery Math Whiz and Novelist Advance Permutation Problem November 5, 2018

소설: ‘케이-알파맨’

어쩌다 한겨레 사이언스 온 사이트에 있는 ‘케이-알파맨’[1]이라는 단편소설을 읽어봤는데, 나름 재미있어서 링크를 남겨봄. ㅋ 저자인 김창대 작가의 페이스북 페이지[2]도 있지만, 1년 이상 새 글이 없다.

.


[1] 사이언스 온 소설: ‘케이-알파맨’ 2016. 03. 18
[2] https://www.facebook.com/holypsychowrites

Woit 선생의 끈이론 비판 글 : 이론물리학의 종말(?)과 인공지능 물리학자

고대인들은 천상의 법칙은 지상의 법칙과 분리된 법칙으로 존재한다고 생각했지만, 뉴턴이 만물을 아우르는 단일 법칙으로 설명하여 지성들에 큰 충격을 주었듯이, 최소한의 이론으로 최대한의 현상을 설명하는 방향이 물리학 발전의 거대한 틀이다. 표준모형을 포함하여 모든 자연현상을 단일 법칙으로 설명하는 궁극의 이론이 어딘가에 반드시 존재한다고 생각하는 것이 자연스러운 사고의 흐름일 것이다.

이 궁극의 이론에 한 발 더 다가간 것이라고 짐작되는 이론 중의 하나가 끈이론이다. 평소 끈이론에 비판적인 Peter Woit 선생이 블로그에 또 끈비판 글[1]을 쓰셨던데, 뭐 이 블로그 글도 그렇고 걍 썰(?)로 흘려 들으시라-_-

1996년에 John Horgan이라는 과학저술가가 다양한 학자들을 인터뷰하고 종합하여 과학 발전이 끝났다고 결론을 내린 글[2]을 썼다고 한다. 이런 책이 있는 줄은 몰랐네. ㅎ 이 책[2]의 번역본이 있나 싶어서 검색해 봤는데, 역자가 불분명한 판본이 있긴 있던데[3] 원체 옛날에 출간된 거라 그런지 이미 절판된 듯 하다. 책의 내용을 대락적으로 추정해보면-_- 과학 연구 그 자체가 쫑났다는 이야기가 아니라, 상대성이론이라든지 DNA의 구조 발견 등등 과학사에 거대한 족적을 남길 정도의 breakthrough가 인제 더 이상은 없을 거라는 이야기 같다. 이거 완전 프랜시스 후쿠야마 선생이 역사 발전은 끝났다[4]고 주장하는 내용의 이과 버전 아닌가-_-???

아무래도 대부분의 과학자들은 Horgan 선생의 주장에 공감하기는 힘들 듯 하지만, end of science는 아닐지라도 end of fundamental physics는 맞을 것 같다는 생각을 하는 사람들이 좀 있는 듯 하다. 본 블로그에서도 현재 이론물리학에서 진전이 막혀있는 상태라서 열라게 위기-_-라는 Giudice 선생의 글 이야기[5]를 한 적이 있는데, 이제 물리학을 근본부터 재고해야 한다는 생각도 나오는 것 같다. 일전에 Lost in Math 책[6] 이야기[7]를 했는데, 이 책[6]의 저자인 Sabine Hossenfelder 선생이 블로그에 현재 정체 상황이 정상이 아니라는 글[8]을 얼마전에 쓰신 듯. 지난 6월에는 Robbert Dijkgraaf 선생이 콴타 매거진에 단일한 큰 법칙이 있는게 아니라 다양한 법칙이 넓게 펼쳐져 있다는 글[9]을 쓴 것 같던데, 그런 맥락인 것 같다. 다양한 견해들이 있는 듯 하다.

뭐 여하간 Woit 선생은 글[1] 마지막에 AI 물리학자 이야기도 하던데, 다양한 사례와 함께 Tailin Wu와 Max Tegmark의 논문[10]을 언급하고 있다. 이거 대충보니 비 지도학습으로 물리학의 이론을 발견하는 것이 가능할까에 대한 이야기 같던데, 내용은 사실 무슨 말인지 거의 이해 못하겠다-_- 이 비슷한 이야기를 하는 듯한 논문[11]도 예전에 본 기억이 있는데, 서로 레퍼런스에 없으니 별 관련이 없을지도 모르겠구만. ㅋ

Woit 선생의 망상(?)대로, 정말 이론물리학이 쫑나고 물리학자도 인공지능으로 대체된다면, 아무래도 물리학자의 미래는 암울해질 듯 하다. ㅎㅎ 근데 일전에 시바의 유전학 선생이 쓰신 딥러닝에 관심꺼라는 글[12]을 본 기억이 나는데-_-, 아무래도 딥러닝으로 물리학자를 만드는 거는 무리가 있는 것 같긴 하다. ㅋ

근데 어째 자꾸 끈비판 물리학자들의 글만 보는 상황이 된건지 모르겠네-_- 다음에는 끈옹호 물리학자의 글을 찾아봐야 할 듯. ㅎ

.


2019.1.17
BBC Cern plans even larger hadron collider for physics search 15 January 2019

.


2019.1.19
new scientest Why CERN’s plans for a €20 billion supersized collider are a bad idea 17 January 2019
웬일인가 했더니 역시나 Hossenfelder 선생의 글이었다.

.


2019.3.18
포브스 Why Supersymmetry May Be The Greatest Failed Prediction In Particle Physics History Feb 12, 2019, 02:00am

.


[1] The End of (one type of) Physics, and the Rise of the Machines (math.columbia.edu/~woit)
[2] Horgan, John (1996), The End of Science: Facing the Limits of Science in the Twilight of the Scientific Age. New York: Broadway Books
[3] 과학의 종말 존 E. 호건 (지은이) | 까치 | 1997-06-10 | 원제 The End of Science
[4] Francis Fukuyama (1992). The End of History and the Last Man. Free Press. ISBN 978-0-02-910975-5
[5] 내 백과사전 Gian Francesco Giudice의 기고글 : 이론 물리학의 위기? 2017년 11월 3일
[6] Lost in Math: How Beauty Leads Physics Astray (amazon.com)
[7] 내 백과사전 수학에서 길을 잃다(Lost in Math) 2018년 7월 10일
[8] The present phase of stagnation in the foundations of physics is not normal (backreaction.blogspot.com)
[9] 콴타 매거진 There Are No Laws of Physics. There’s Only the Landscape. June 4, 2018
[10] Tailin Wu, Max Tegmark, “Toward an AI Physicist for Unsupervised Learning”, arXiv:1810.10525 [physics.comp-ph]
[11] Raban Iten, et al. “Discovering physical concepts with neural networks”, arXiv:1807.10300 [quant-ph]
[12] https://www.facebook.com/genetics001/posts/1954647407984219

mBox : 음성으로 적외선 리모컨 신호 제어

양주동 선생의 불멸의 쾌작인 ‘문주반생기'[1]에 따르면, 횡보 염상섭이 동경유학시절에 원고료를 받은 날 바로 친구와 술마시는데 돈을 다 써버린 나머지, 다음 돈을 벌 때까지는 생계유지비조차 없어, 최소한의 에너지 소모를 위해 맥주병에 오줌을 채우며-_- 방바닥에 누워 지냈다고 하다. 그의 벽에 써 놓은 표어는 바로 동즉손(動卽損 – 움직이는 것은 즉 손해)이었으니, 과연 귀차니스트의 표상이라 할만 하다. ㅋㅋㅋㅋ

나도 횡보 염상섭 선생의 ‘동즉손’ 정신을 이어받아-_- 리모컨으로 뭔가를 제어한다는 거 자체가 초 귀찮아서, 음성으로 에어컨을 제어할 수 없을까 궁리하다가 이리저리 검색해보니, mBox라는 물건[2]을 팔고 있었다. 스마트 스피커랑 연동이 돼서 음성명령을 하면 IR리모컨 신호를 뿌려주는 기기다. 외양은 한 변의 길이가 5cm정도의 정육면체 처럼 생겼다.

사실 스마트 스피커랑 연동해서 IR 신호 쏘는게 그리 어려운 기술은 아닐 듯 하고, 해외 제품도 꽤 있어서 예전부터 나도 구현해보고 싶었는데, 쉽지 않았다-_- 전자부품 사이트에서 라즈베리 파이GPIO에 연결하는 IR 수신기랑 송신기를 구입해가지고 이리저리 시도해봤는데, 지식부족으로 실패한 경험이 있다ㅠㅠ 젠장-_- 검색해보면 회로이론에 지식이 있는 사람들은 이미 각자 알아서 구현하여 잘 쓰고 있는 것 같다.

그런 삽질을 불필요하게 만드는 이런 반가운 물건이 나왔으니, 얼른 구매하지 않을 수 없다. 나온지 꽤 된 듯 한데, 여태 모르고 있었네. ㅎㅎ

여하간 집이랑 사무실에 각각 쓰려고 mBox 두 개를 구입해 봤다. 사양상 아마존 에코[3], 구글 홈[4], 네이버 클로바[5]와 연동이 된다고 되어 있다. 근데 시험해보니 네이버 클로바와는 매우 잘 작동하는데, 아마존 에코로 도무지 작동되지 않았다. 스킬 등록하려면 enable skill창에 HK네트웍스에 로그인을 해야 하는데, 아무리 용을 써도 로그인이 안 된다… 젠장. 결국 사무실에서는 그냥 음성인식 없이 휴대폰으로만 제어하기로 함.

집에서는 네이버 클로바로 제어하는데, 대단히 잘 작동한다. 리모컨을 여러 개 등록할 수 있어서, 이거 하나로 TV, 에어컨이 모두 제어된다. 천정 에어컨도 제어되는걸 보면, 사방팔방으로 IR신호를 뿌려주는 듯 하다.

추가 구성품으로 플러그[6]도 하나 샀는데, 네이버 클로바를 이용해 음성명령으로 플러그에 전원을 넣었다가 차단했다가 할 수 있다. 근데 플러그는 몸통이 너무 커서 멀티탭에 꽂으면 양 옆의 구멍에 꽂는데 방해된다.

구글 홈으로는 굳이 연동할 필요가 없어서 안 해 봤음.

전압/전류는 5V 1A를 사용하고, 마이크로 5핀 usb충전기로 전원을 넣으면 된다. 기본 구성품에 usb충전기가 없는데, 폰 몇 번 바꾸면 남아 도는게 충전기라..-_- 문제는 없을 듯 하지만, 혹시나 여분의 usb충전기가 없는 분들은 별도로 준비해야 할 것이다.

IR 리모컨은 어지간한 대기업 제품이면 기본 등록만으로 다 되지 않을까 싶은데, 혹시나 목록에 없는 리모컨 신호가 필요한 경우, IR 리시버도 달려 있어서 학습이 가능하다고 돼 있다. 근데 본인이 가진 제품은 전부 LG 리모컨 호환 제품들이라 이 기능은 안 써 봤음.

누워서 음성명령으로 플러그에 전원 넣고, TV 켜서, TV에 달린 크롬캐스트를 구글 홈으로 제어하면서 유튜브를 보니 쓸데없이 시간 잘 간다-_- 여하간 방안의 조명, TV, 에어컨, 플러그까지 몽땅 꼼짝도 안하고 누워서 제어가 되니 초 편하네. 그야말로 ‘동즉손’이다 ㅋㅋㅋㅋㅋㅋ

.


[1] http://zariski.egloos.com/2570557
[2] mBox (hknetworks.kr)
[3] 내 백과사전 아마존 에코로 선풍기 음성 제어 ㅋㅋ 2018년 4월 7일
[4] 내 백과사전 구글 홈 간단 사용기 2018년 9월 21일
[5] 내 백과사전 네이버 wave 사용 소감 2018년 9월 8일
[6] S플러그 (hknetworks.kr)

AlphaFold : 구글 딥마인드의 단백질 접힘 예측

대부분 소식을 이미 들으셨을 듯 하지만, 블로그에 기록차 남겨봄.

아미노산의 연결상태가 결정되면, 그 단백질이 어떻게 접혀서 3차원 구조로 만들어지는지가 거의 항상 결정된다고 들었다. 이런 접히는 3차원 구조를 예측하는 문제를 단백질 접힘 문제라고 한다. CASP라는 단백질 접힘을 예측하는 대회가 있는 줄 처음 알았는데, 위키피디아에 따르면 2년에 한 번씩 열린다고 한다. 올해가 13번째 개최라서 CASP13이라 부르는 것 같다.

구글의 딥마인드가 CASP13에 A7D라는 팀명으로 참가한 모양[1]인데, 여기서 최고 득점을 올리고 있는 듯[2]하다. 근데 표를 보는 법은 하나도 모르겠다-_- 여기 z-score가 정규분포의 표준화한 값을 말하는 건가??? 뭐 여하간 제일 점수가 높은 게 제일 잘하는 거겠지 뭐-_-

구글 딥마인드 홈페이지[1]에 대략적 설명이 있는데, 일단 상업적 용도를 생각하지 않고, 미지의 분야에서 다른 방법을 가지고 뛰어드는 모습이 대단하다고 생각한다. 이런건 빅테크 기업들이 아니면 어렵지 않겠나 싶다. 근데 이제 단백질 접힘 화폐[3]는 망한 건가-_-

단백질 접힘 자체도 문제지만, 이것은 연구의 출발점일 뿐이라는 Mad Scientist 선생의 페북 코멘트[4]도 참고바람. 지금 보니 해커뉴스[5]에서도 올라왔었네. 왜 못 봤지. ㅋ 방법이 좀 불명확하다고 회의적인 시각도 있는 듯 하다.

.


2018.12.6

.


2018.12.8
science Google’s DeepMind aces protein folding Dec. 6, 2018 , 12:05 PM

.


2018.12.9
[바이오토픽] 구글 딥마인드의 최신병기 알파폴드(AlphaFold), 단백질의 3D 형태 예측 (ibric.org)

.


2018.12.10
구글이 알파폴드의 소스코드를 공개할 예정이 없다고 하던데[6], 그동안 큰 진전이 없던 CASP에서 지난 CASP11, CASP12동안은 진보를 보인 만큼[6], 그들의 이번 결과는 특별한 진보적 방법을 사용한게 아니라 구글의 막대한 컴퓨팅 파워에 기반을 두고 있을 가능성도 있다. 소스코드를 공개하지 않는 이상, 그들의 업적에 너무 과찬을 할 필요는 없을 듯 하다.

.


2018.12.15

Posted by Taeho Jo on Tuesday, December 11, 2018

.


2019.2.19

.


2019.3.25
MIT news Model learns how individual amino acids determine protein function March 22, 2019
인공지능 신문 신경망(CNN)으로 단백질 자동 설계 위한 알고리즘 개발 2019.03.24 09:09

.


[1] AlphaFold: Using AI for scientific discovery (deepmind.com)
[2] TS Analysis : Group performance based on combined z-scores (predictioncenter.org)
[3] 내 백과사전 단백질 접힘 화폐 FoldingCoin!! 2015년 1월 30일
[4] https://www.facebook.com/madscietistwordpress/posts/1159689967511753
[5] AlphaFold: Using AI for scientific discovery (hacker news)
[6] AlphaFold @ CASP13: “What just happened?” (moalquraishi.wordpress.com)

GAN과 이더리움을 이용한 애니 캐릭터 생성과 거래 : Crypko

ERC는 Ethereum Request for Comments의 약자로, 이더리움의 발전과 방향에 대해서 이더리움 커뮤니티에 제안하는 기술표준이라고 한다. 제안된 순서로 번호가 붙는데, 그 중 20번 제안이 가장 유명한 것 같다. ERC-20은 블록체인 내 스마트 계약의 프로토콜을 설정하는 이야기 같다. 뭐 본인도 여기까지밖에 모른다-_-

ERC-721은 이더리움 네트워크상에서 복제, 위변조 불가능한 토큰을 설정하는 제안이라고 하는데, 확실치는 않지만 작년에 이더리움 네트워크에 채택된 듯 하다. 아무래도 일전에 이야기한 SuperRare[1]는 이 ERC-721을 기반으로 사업을 구상한 것 같다.

이더리움 블록체인 상에서 고양이를 사고 팔거나 번식시켜 새로운 고양이를 만드는 CryptoKitties에 대해서도 들어본 적이 있는데, 이 역시 ERC-721을 기반으로 작동한다고 한다. 이 게임이 너무 히트치는 바람에 비싼 것은 10만달러에 거래되는 경우[2]도 있고, 이 게임으로 인해 이더리움 해시파워의 30%가 소모될 정도[3]로 인기가 있다고 한다. 진명황의 집행검에 비하면 껌값인듯 ㅋㅋㅋ

한편, 일전에 이야기한 GAN[4]을 활용하여, 인물 사진뿐만 아니라 애니메이션 캐릭터를 생성하는 연구[5]도 본 적이 있는데, 일본 애들이 이런거 많이 하는 듯. ㅋㅋㅋ 훌륭한 연구다. ㅋㅋㅋ

더구나 이 두 가지를 합쳐서, GAN으로 생성된 애니 캐릭터를 ERC-721 기반으로 거래를 하는 사업 아이디어를 구상하는 사람들이 있는 모양이다. 이름하여 Crypko[6] 라고 한다. 헐-_- 물론 ~ko(~子)는 일본 여성이름에 흔히 붙는 글자다. 홈페이지에서 백서[7]를 다운로드 받아서 여러가지 기술적 정보를 확인할 수 있다. 기본적인 거래 구조는 CryptoKitties와 동일할 듯 하다.

들을 노리는 사업구조이긴한데, 덕들은 단순히 그림체만 보는게 아니고 원소스 멀티유즈 형태로 캐릭터의 성격에 빠져드는 것이므로, 그림만으로 얼마나 어필할 수 있을지 궁금해지는구만.

하룻밤 자고 일어나면 새로운 아이디어가 속출하는 세상이니 정신이 하나도 없구만. ㅋㅋ

.


2018.11.21
소니, 내년 PS4용 블록체인 게임 ‘첫 선’ (blockdaily.com)

.


[1] 내 백과사전 디지털 예술작품을 이더리움을 통해 판매하기 : SuperRare 2018년 9월 13일
[2] cnbc Meet CryptoKitties, the $100,000 digital beanie babies epitomizing the cryptocurrency mania 12:42 PM ET Wed, 6 Dec 2017
[3] 지디넷 과도한 블록체인 기대감 덜어드립니다 2017.12.07.17:49
[4] 내 백과사전 generative adversarial network로 생성한 고해상도 인물 이미지 2017년 10월 28일
[5] Koichi Hamada, et al. “Full-body High-resolution Anime Generation with Progressive Structure-conditional Generative Adversarial Networks”, arXiv:1809.01890 [cs.CV]
[6] https://crypko.ai/#/
[7] Whitepaper pdf 5.9MB (crypko.ai)

구글 홈 간단 사용기

과학기술은 자고로 국경이 없어서, 중국의 짝퉁 기술 카피캣 전략이 먹힐 때가 많았다. 근데 자연어 처리 만큼은 국경을 넘는 것이 쉽지 않아서, 중국의 스마트 스피커 개발에 애로사항이 많다는 기사를 예전에 본 적이 있었는데, 도통 출처가 기억이 안 나네-_- 여하간 구글이 아무리 엄청난 기술기업이라서 다른 건 다 앞서갈 수 있어도, 한국어 처리 능력만큼은 엄청난 우위에 있지는 않을 듯 하다. 다만, 한국어 음성인식만큼은 초창기부터 선보였으니 꽤 앞서있을 듯 하긴 하다. ㅋ

오늘 구글 홈 한국 정발 물건을 받아서 잠시 소감을 써봄. ㅋ 원래 한국어 어시스턴트가 똥같은 남자 목소리였기 때문에-_- 안 사려고 했는데, 걍 일본어로 쓰면 될 것 같고 성능도 궁금해서 사봤음. ㅋㅋㅋ 참고로 일본어 구글 어시스턴트는 여자 목소리로 나온다. ㅋㅋㅋㅋ

아답터가 놀랍게도 16.5V 2A (외경/내경 3mm/1mm 정도)였는데, 여러가지 노트북/모니터 등등을 봐 왔지만 이런 요상한 볼트수를 쓰는 가전제품을 본 적이 없다. 아마존 에코[1]는 15V를 쓰기 때문에 아답터가 고장나거나 마음에 안들면 간단히 대체품[2]을 찾을 수 있지만, 이건 아답터 고장나면 답이 없을 듯. 뭐 아답터가 쉽게 고장날 물건은 아니지만, 오래써서 죽는 아답터를 세 번 정도 본 적이 있다. ㅎ

가장 실망한 부분은 hotword의 인식능력이었는데, 일단 아마존 에코에 비해서 현저하게 인식력이 떨어진다. 에코는 스피커에서 뉴스가 나오든 음악이 나오든 ‘알렉사’라는 단어는 귀신같이 알아듣는데-_- 구글 홈은 뉴스가 나올 때 hotword를 초 못 알아 듣는다. 와. 이럴수가. 이걸 이렇게 써 본 사람이 하나도 없나?? 웨이브[3]보다 더 떨어지는 느낌이다. ‘오케이 구글’에서 한 글자라도 발음이 불명확하면 생깐다-_- 사실 이게 별거 아닌 듯 하지만, 사람의 생활을 풍요롭게 하고자 쓰는 물건인데, 출근하기전에 대충 말해서 날씨 듣고 오늘 뉴스 대충 듣고 나가려는데, 인식 안돼서 번거롭게 사람의 인지를 소모하게 되면 주객전도나 다름이 없다. 본인은 자다가 깨서 눈앞이 잘 안보이는 비몽사몽일 때, 몇 시냐고 물어서 시간을 확인할 때도 있다. 이처럼 생활 속에서 자연스럽게 물흐르듯이 옆에 항상 대기하는 비서처럼 사용해야 한다면, hotword에 강해야 한다고 본다.

여하간 기본적으로는 구글 어시스턴트와 성능이 같으므로, 얼마나 유용할지 구입이전에 확인하고 싶다면 구글 어시스턴트로 확인해보는 것이 좋을 듯 하다. 일전에 본 웨이브의 맥락 인식 기능[4]도 되는 듯.

에코에는 ‘오늘의 화제는?’과 같이, 알아서 불특정 정보나 잡지식, 달력일정 등을 큐레이션 해주는 기믹들이 좀 있는데 그런게 좀 적어서 아쉽다. ㅎ

오직 스피커로서의 소감을 말해보라면, 우퍼가 꽤 세서 음악 듣기에는 좋은데, 이 덕분인지 몰라도 정작 어시스턴트의 목소리가 매우 탁하다.

구글도 사실 아마존이 열어놓은 시장을 따라가는 카피캣의 입장이니만큼 아마존보다 더 나은 모습을 보여야 맞지 않나 싶은데, 아직까지는 아마존 에코에 점수를 더 주고 싶다. 에코 스팟[5]을 써보니, 스마트 스피커가 앞으로 이렇게 변하겠구나 싶은데, 역시나 구글이 또 카피캣을 한다는 기사[6]가 나왔다. 아마 국내 스피커도 따라가지 않을까 싶구만.

.


2018.9.22
wave나 echo에 비해 단어만 던지는 명령들은 굉장히 인식률이 낮다. ‘中止’라고만 말하면 거의 못알아 듣고 ‘中止して’라고 말하면 알아듣는다. 중지, 재생, 다음 등등 이런 게 몇 개 있다. 아무래도 2개 국어를 인식해야되다 보니 이런 오작동을 하는 듯 한데, 좀 아쉬운 부분이다.

.


2018.9.23
갑자기 뉴스를 읽는데 에러난다. 구글 홈이 여태까지 써 본 스마트 스피커 중에서 제일 스트레스 받을 때가 많다. 와 이럴 수가 있나. 사용자 측면에서 봤을 때 구글 홈이 제일 완성도가 떨어진다.

.


[1] 내 백과사전 아마존 에코로 선풍기 음성 제어 ㅋㅋ 2018년 4월 7일
[2] 태영전자 15V 1.5A 정전압 SMPS 직류전원장치 아답터 (auction.co.kr)
[3] 내 백과사전 네이버 wave 사용 소감 2018년 9월 8일
[4] 샐리야, 송혜교 몇 살이야? (youtube 36초)
[5] 내 백과사전 아마존 에코 spot 두 개 사용소감 2018년 9월 4일
[6] 화면 달린 AI 스피커, ‘구글 홈 허브’ 나온다 (bloter.net)

[서평] 카카오 AI 리포트 – 인간과 인공지능을 말하다

카카오 AI 리포트 – 인간과 인공지능을 말하다
카카오 AI 리포트 편집진 (지은이) | 북바이북 | 2018-09-10

.


카카오에서 인공지능을 주제로 발간하는 월간지[1]가 있는 모양인데, 이번에 처음 알았다. 이 월간지에 게재된 글을 모은 책이라고 한다.

여러 명의 저자가 쓴 글들을 모아놓은 책이므로, 다방면에서 AI와 관련된 주제들이 매우 광범위하게 논의되고 잇다. 상당히 기술적인 부분을 설명하는 내용도 있고, 데이터 취급이나 서비스 제공시에 고려해야 할 사항을 논하는 글도 있고, AI의 윤리나 도덕에 대한 글도 있다. 각자 관심분야를 골라 읽으면 될 듯 하다.

어느 정도는 이미 알고 있는 내용이었는데, 상당히 많은 몰랐던 이야기들이 많이 언급되고 있다. 일부 내용은 본 블로그에서도 언급한 적이 있다. 책의 앞부분에서 언급되는 딥 러닝의 역사는 여러 경로[2]로 접할 수 있다.

구글이 딥 러닝으로 안저 영상 판독을 했다는 유명한 2016년의 결과[3]가 책에서 상당히 여러 번(p31, p392, p414, p505) 언급되는데, 확실히 임팩트 있는 결과이긴 하지만, 이 결과가 재현 안된다는 주장[4]도 있다는 점을 독서하실 때 참고하기 바란다.
p95에 딥 러닝을 fooling 하는 이야기가 나오는데, 본 블로그에서도 언급한 적[5]이 있다.
p114에 기계학습 모델링으로 주가 예측하는 이야기가 나오는데, 글에서도 주석으로 언급하지만 Knight Capital이 자동매매 오류로 40분동안 4억달러의 손실을 본 사건[6]은 유명하다. 잘 벌다가도 날리는 건 한순간이 아닌가-_- 싶다. 갑자기 오르비 관리자가 AI로 자동 주식 매매를 하고 있다는 이야기[7]가 생각나는구만-_-
p166에 알파고 제로에 대한 네이쳐 논문[8]을 설명하는 글이 나오는데, 일전에도 이야기[9] 했지만 여전히 모르겠다-_-
p189부터 음성인식 인터페이스의 장점에 대한 글이 나오는데, 일전에 읽은 이코노미스트지의 기사[10]와 매우 유사한 느낌이다. 참고하면 좋을 듯 싶다.

한 가지 불편한 점이 있다면, 종이책이라서 뒤쪽 참고문헌에 제시된 url을 일일이 손으로 타이핑해서 들어가야 하는 불편함이 있는데, 전자책으로 나오면 나름 불편함이 해소되지 않을까 싶다.

정보통신기술진흥센터에서 발간하는 ‘주간기술동향’[11]을 관심있게 본다면, 스타일이 비슷하므로 재미있게 읽을 수 있다. 나름 재미있었음. ㅋ

.


[1] 카카오 AI리포트 2017 모음집 (brunch.co.kr)
[2] 내 백과사전 딥 러닝의 간략한 역사와 연구 동향 2016년 4월 20일
[3] Varun Gulshan, Lily Peng, Marc Coram, et al, “Development and Validation of a Deep Learning Algorithm for Detection of Diabetic Retinopathy in Retinal Fundus Photographs” (December 13, 2016) JAMA. 2016;316(22):2402-2410. doi:10.1001/jama.2016.17216
[4] Mike Voets, Kajsa Møllersen, Lars Ailo Bongo, “Replication study: Development and validation of deep learning algorithm for detection of diabetic retinopathy in retinal fundus photographs”, arXiv:1803.04337 [cs.CV]
[5] 내 백과사전 1픽셀로 deep neural network를 무력화 하기 2017년 10월 31일
[6] 뉴욕타임즈 Knight Capital Says Trading Glitch Cost It $440 Million AUGUST 2, 2012 9:07 AM
[7] 오르비는 무엇을 하는 회사인가 (orbi.kr)
[8] David Silver et al. “Mastering the game of Go without human knowledge”, Nature volume 550, pages 354–359 (19 October 2017) doi:10.1038/nature24270
[9] 내 백과사전 AlphaGo Zero의 원리를 한 장의 이미지로 설명하기 2018년 2월 26일
[10] 이코노미스트 How voice technology is transforming computing Jan 7th 2017
[11] 주간기술동향 (itfind.or.kr)