일본어 한자 빈도분석 : 일상 일본어의 90%를 커버하는 777개의 한자

에드거 앨런 포의 유명한 소설 ‘The Gold-Bug‘에는 영문에 등장하는 알파벳의 출현 비율이 다르다는 사실을 이용해 암호를 해독하는 빈도분석법이 등장하는 장면이 있다. 고전적이고 기초적인 암호해독 기법 중 하나이긴 한데, 일전에 이걸 너무 남용한 사례에 대한 이야기도 한 적[1]이 있다. ㅎㅎㅎ

해커 뉴스[2]에 일상 일본어의 90%를 커버하는 777개의 한자에 대한 이야기가 나와 있던데, 원문[3]에는 무슨 근거로 777개의 한자를 선택한 건지 출처가 제대로 나와 있지 않다. 해커 뉴스의 댓글을 보니 누가 그걸 찾아놨길래, 그 연구[4]를 대충 봤다.

보니까 아시히 신문 기사를 기반으로한 코퍼스를 바탕으로 통계를 낸 것 같다. appendix A[4;p489]에 대략 상위 3000개의 한자를 빈도수와 함께 나열하고 있다. 본인의 초 짧은 일본어 실력으로는 100위 정도까지밖에 모르겠다-_- 사실 90%면 원활한 일상 글읽기에는 좀 문제가 있는 수준이긴 하지만, 모르는 단어는 문맥상 대충 때려맞춘다고 가정하면, 핵심 및 분위기 파악 정도는 가능한 수준의 독해 능력이 아닐까 싶다. 근데 요새는 한-일 번역기 수준이 꽤 좋아서, 일본어를 전혀 몰라도 텍스트의 핵심파악 같은 건 쉽게 되긴 한다-_- appendix B에는 히라가나, appendix C에는 카타카나의 출현 빈도가 나와 있다. 본 블로그에서는 첫 300개 한자만 올려 놓음.

아무래도 기반이 신문기사다 보니까, 정치관련 한자(정당 이름이라든지)가 상당히 상위권에 있는 듯 하다. 일상 회화에서 그런 한자 출현빈도는 좀 떨어진다는 점을 감안해야 할 듯 하다.

한글 자모의 통계도 궁금해서 찾아봤는데, 국립국어원 홈페이지에서 제공하는 2005년 통계[5]가 있었다. 통계의 기본이 된 코퍼스는 명확하지는 않지만 세종 코퍼스를 쓴 듯 하다. 어디서 듣기로는 한국어 코퍼스 중 이용가능한 유일한 코퍼스라나 뭐라나-_-

1	2105587	초성	ㅇ
2	1926007	중성	ㅏ
3	1355527	중성	ㅣ
4	1328090	종성	ㄴ
5	1171038	초성	ㄱ
6	1151976	중성	ㅡ
7	942819	중성	ㅓ
8	862073	중성	ㅗ
9	800785	초성	ㄷ
10	776891	종성	ㄹ
11	756477	초성	ㅅ
12	748509	초성	ㅈ
13	635299	초성	ㅎ
14	617205	종성	ㅇ
15	610211	초성	ㄹ
16	596893	초성	ㄴ
17	592419	중성	ㅜ
18	429661	초성	ㅁ
19	422490	중성	ㅕ
20	411538	종성	ㄱ
21	409768	중성	ㅐ
22	393695	중성	ㅔ
23	359029	초성	ㅂ
24	258542	종성	ㅁ
25	219186	종성	ㅆ
26	200266	초성	ㅊ
27	179818	중성	ㅢ
28	162656	중성	ㅘ
29	133729	종성	ㅂ
30	114592	종성	ㅅ
31	106679	초성	ㅌ
32	99794	중성	ㅚ
33	98986	초성	ㅍ
34	94576	중성	ㅛ
35	72604	초성	ㄸ
36	64997	초성	ㄲ
37	63728	중성	ㅑ
38	57373	중성	ㅝ
39	48097	초성	ㅋ
40	47506	중성	ㅟ
41	47135	중성	ㅠ
42	44394	중성	ㅖ
43	30376	종성	ㄶ
44	29184	초성	ㅆ
45	26948	종성	ㅎ
46	25868	종성	ㅄ
47	25341	종성	ㅌ
48	20434	초성	ㅉ
49	18535	종성	ㄷ
50	17173	종성	ㅈ
51	16938	종성	ㅍ
52	16037	초성	ㅃ
53	11215	중성	ㅙ
54	9944	종성	ㅊ
55	7330	종성	ㄺ
56	6068	종성	ㄲ
57	4344	종성	ㄻ
58	3769	중성	ㅒ
59	3023	종성	ㅀ
60	2790	종성	ㄵ
61	2183	종성	ㄼ
62	2035	중성	ㅞ
63	357	종성	ㄳ
64	302	종성	ㅋ
65	131	종성	ㄾ
66	78	종성	ㄿ
67	5	종성	ㄽ

근데 을 쓰는 한국어 단어가 있긴 있나??? 싶어서 검색을 해 봤는데, 있긴 있었다-_-

.


[1] 내 백과사전 자연어 처리로 Voynich manuscript를 해독하기 2018년 9월 13일
[2] The most frequent 777 kanji, gives 90% coverage of Kanji in the wild (hacker news)
[3] The Triple 7 Kanji List (japanesecomplete.com)
[4] Chikamatsu, N., Yokoyama, S., Nozaki, H. et al. “A Japanese logographic character frequency list for cognitive science research” Behavior Research Methods, Instruments, & Computers (2000) 32: 482. https://doi.org/10.3758/BF03200819
[5] 현대 국어 사용 빈도 조사 2 (korean.go.kr)

한국어 번역 방해기

숙박업자가 숙박 리뷰에 나쁜 평을 삭제하기 때문에, 외국 숙박 리뷰에서 번역기를 회피하는 한국어 사용자 전용 리뷰를 남기는 사람이 있었다.[1,2,3] 이거 제일 처음에 누가 생각한건지 하여튼 잔머리 하나는 끝내주는구만. ㅋㅋ

어떤 사람이 한국어 번역 방해기[4]를 만든 걸 봤는데, 이런 작업을 자동화 해주는 사이트다. 근데 시험삼아 ‘한구거 벉엮 방햬긔’를 구글 번역기로 돌려봤더니[5] ‘Korean translation jammer’라고 정확하게 번역 되어 나온다!!! 구글 번역기 진짜 대단하구만. ㅋㅋㅋ 이거보다 더 높은 레벨의 jammer filter를 사용해야 정상번역이 안 된다.

일전에 본 1픽셀 방해를 하거나[6]나 방안의 코끼리[7]를 두어 이미지 인식 방해를 하는 것처럼, 이것도 문장 인식 방해라는 점에서 일종의 인공지능 fooling이라 생각해도 좋을 듯 하다. 일전에 의료 영상에 악의적 에러를 포함시켜, 인공지능의 오진을 유도하는 공격법에 대한 연구[8,9]를 들은 적이 있는데, 이런 종류의 jammer를 만들고 그것을 회피하는 등의 창과 방패싸움은 끝이 없을 듯 하다.

.


2019.5.13
“한글 번역 방해기”를 소개합니다. (bomdol.tistory.com)

.


2019.7.18

단어우월효과는 한국어에만 있는 현상은 아니라고 함.

.


[1] 조선일보 ‘한국인 전용’ 여행 후기 번역기 돌려보니? 2017.05.22 21:44
[2] 외국 숙박 후기에서 보는 한글의 위대함.jpg (todayhumor.co.kr)
[3] 인사이트 ‘구글 번역기’는 해석 못하지만 우리는 알아듣는 한글의 위대함 2018.10.08 19:23
[4] 한국어 번역 방해기 (xeno.work)
[5] 한구거 벉엮 방햬긔 google 번역 결과 (translate.google.com)
[6] 내 백과사전 1픽셀로 deep neural network를 무력화 하기 2017년 10월 31일
[7] “The Elephant in the Room”, Amir Rosenfeld, Richard Zemel, John K. Tsotsos, (Submitted on 9 Aug 2018) arXiv:1808.03305 [cs.CV]
[8] https://www.facebook.com/yoonsup.choi/posts/2744397698933510
[9] Samuel G. Finlayson, et al. “Adversarial attacks on medical machine learning”, Science 22 Mar 2019: Vol. 363, Issue 6433, pp. 1287-1289, DOI: 10.1126/science.aaw4399

French leave : 몰래 떠나다

유튜브에서 러시아어 idiom을 설명하는 영상[1]을 봤는데, 러시아어에서 “영국인처럼 떠나다(уйти по-английски)”라는 idiom의 의미는, 영어에서 “프랑스인처럼 떠나다(French leave)”라는 뜻이라고 설명하는 거다-_- 이게 뭔 말이야? 혼란하다 혼란해-_-

근데 영어사전[2]을 보니 French leave라는 표현이 있었다!! 헐 처음 알았네. ㅋㅋ 은근슬쩍 몰래 도주하는 행위를 가리키는 idiom이다. 위키피디아에 따르면 유럽언어들은 이런 행위를 다른 나라 사람으로 표현하는 것이 일반적인 듯 하다. 위키피디아에 나온 내용을 옮겨보면 다음과 같다.

체코어 -> 영국
프랑스어 -> 영국
독일어 -> 프랑스 또는 폴란드
헝가리어 -> 영국
이탈리아어 -> 영국
폴란드어 -> 영국
루마니아어 -> 영국
우크라이나어 -> 영국
포르투갈어 -> 프랑스
러시아어 -> 영국
스페인어 -> 프랑스
왈롱어 -> 영국
영국 -> French leave 말고도 Irish goodbye라는 표현도 있는 모양이다.

.


이걸 보니 Greek to me라는 idiom이 생각나는데, 무슨 말인지 눈꼽만큼도 못 알아 들을 때, 영어로는 “나에게 그리스어다”라는 표현을 쓴다. 근데 이게 또 국가별로 복잡한 관계를 가진다. 유명한 언어학 블로그인 Language log에 알아보기 쉽도록 언어별 directed graph[3]가 나와 있으니 이미지를 카피해서 올려본다.

그리스어로는 ‘중국어 같다’는 표현을 쓰는데, 많은 언어들이 중국어를 가리킨다고 한다. 근데 정작 만다린이나 광동어에서는 ‘鬼畫(유령같은 그림)’이나 ‘天書/天书(하늘의 문자)’와 같은 표현을 쓰는 듯 하다.

일본어에는 본인이 알기로 외국어로 표현하는 idiom이 없는 걸로 알고 있다. 다만, 일본어로 전혀 이해가 안 되는 말이라는 의미로 ちんぷんかんぷん(친푼칸푼)이라는 표현이 있는데, 예전에 알렉사[4]에게 물어보니-_- 이 말은 에도 시대때 네덜란드 사람들의 말을 듣고, 그 소리를 흉내내서 탄생한 표현이라고 한다. 진짠가 싶어서 검색해보니 그 비슷한 설명[5]이 있긴 있었다.

10년 전에 야쿠시마에서 삽질-_-을 할 때[6], 섬에서 히치하이킹을 할 때, 내가 일본어를 독학했다고 말하니, 할배가 ‘나한테는 외국어는 친푼칸푼이여~~’라는 말을 하는 걸 들은 경험이 있다. 그 순간, 바로 얼마전에 외운 단어를 직접 원어민에게 듣는 카타르시스(?) 비스무리한 경험이 아직도 기억에 남는다. ㅎㅎㅎㅎㅎ

한국어에는 이에 대응하는 표현이 없는 게 아쉽구만. ㅎㅎ 아무래도 역사 기간 동안 외국어와의 접촉이 많지 않아 그런 것일지도 모르겠다.

.


[1] Popular Russian idioms (youtube 5분 10초)
[2] French leave (dic.daum.net)
[3] The directed graph of stereotypical incomprehensibility (languagelog.ldc.upenn.edu)
[4] 내 백과사전 아마존 에코로 선풍기 음성 제어 ㅋㅋ 2018년 4월 7일
[5] ちんぷんかんぷん (gogen-allguide.com)
[6] http://zariski.egloos.com/2414218

f 와 v 발음은 신석기 이후 부드러운 음식 때문에 발생했다는 주장

popular archaelogy 기사[1]를 보니 사이언스지에 실린 흥미로운 연구[2]에 대한 이야기가 있어 포스팅함.

한국어에는 없지만 영어에는 있어서, 토종 한국인들이 영어로 말할 때 발음이 어색한 요인들 중의 하나가 f와 v와 같은 labiodental consonant가 아닐까 싶다. 과거에 언어학자 Charles Hockett 선생이 f와 v발음은 신석기 이전에는 인류 언어에 없었다가, 농업혁명으로 인해 음식들이 부드러워지는 변화로 생겨났다는 혁명적인(?) 주장[3]을 한 적이 있었던 것 같다.

세계 여러 언어들에는 영어의 a와 m과 같은 일반적인 발음도 있지만, 일전에 이야기한 Click consonant[4]와 같은 독특한 발음도 있는데, 이와 같은 언어의 발음다양성은 일반적으로 우연적 결과로 설명되는 것이 보통이라 Hockett 선생의 주장은 인류학계에서 나름 파격적이었던 모양이다. 뭐 본인은 다 처음 듣는 이야기라 틀릴 수도 있으니 대충 흘려 들으시라-_-

여하간 그래서 먹는 걸 모델링해서 시뮬레이션 해봤다는 주장같은데, 얼마나 설득력이 있을지는 모르겠다. 중국어만 해도 f 발음이 있지만, 한국어/일본어에는 없는데, 중국인이랑 한국인의 음식의 경도 차이가 얼마나 날런지… ㅎㅎ 게다가 파푸아뉴기니 섬 내의 놀라운 언어다양성[5]은 음식으로 설명가능할 듯하지는 않아 보인다. 아무래도 언어다양성은 우연성이 더 클 듯 하다.

여하간 언어학과 고인류학 모두에 관심이 있는 본인으로서는 재밌어서 글을 함 써봄.

논문에 자주 나오는 edge-to-edge bite라는 말을 처음 들었는데, 앞이빨로 음식을 자르는 씹기를 의미하는 듯. 검색해보니 치과 관련 사이트가 엄청 많이 나오네-_-

.


2019.3.16
이코노미스트 에스프레소 What the F? language Mar 16th 2019

.


2019.3.19
[바이오토픽] 동영상으로 보는 순치음(脣齒音)의 비밀 – 인류의 언어를 바꾼 식생활 (ibric.org)

.


[1] popular archaelogy Diet-Related Changes in Human Bite Spread New Speech Sounds Thu, Mar 14, 2019
[2] “Human sound systems are shaped by post-Neolithic changes in bite configuration”, D. E. Blasi, S. Moran, S. R. Moisik, P. Widmer, D. Dediu, B. Bicke, Science 15 Mar 2019: Vol. 363, Issue 6432, eaav3218 DOI: 10.1126/science.aav3218
[3] C. F. Hockett, Distinguished lecture: F. Am. Anthropol. 87, 263–281 (1985). doi: 10.1525/aa.1985.87.2.02a00020
[4] 내 백과사전 Click consonant 흡착음 2015년 5월 29일
[5] 내 백과사전 파푸아뉴기니의 언어 다양성 2013년 12월 27일

음성기호 Phonetic Code

보나파르트 나폴레옹은 원래 해군을 지원했는데, 사관학교에서 수학성적이 좋은 바람에 포병을 추천받았다고 한다.[1] 이후 방데미에르 쿠테타에서 나폴레옹이 대포를 이용한 신속한 진압에 성공하여 유명인사가 되었고, 이후 승승가도를 달리며 승진하였다. 만일 역사상 최고의 장군[2]인 나폴레옹이 포병이 아니었다면 진짜로 세계사는 상당히 달라졌으리라 생각한다. ㅎㅎㅎㅎ 이는 국내사정도 비슷한데, 주변사람들을 관찰해보니 경험상 수학과 남학생들은 특별히 지원병과가 없으면 대체로 포병/박격포 주특기를 받게 되는 듯 하다. 본인도 측지반에서 복무했다. 무릇 포병과 수학은 (쓸데없지만) 나름 연관이 있다고 생각한다. ㅋㅋㅋㅋ

무전병이나 포병은 원거리에서 정보를 주고받아야 하기 때문에, 나름의 Error detection and correction 시스템을 갖춰야 하는데, 수치를 주고받을 때 쓰는 숫자 읽기로 ‘하나 둘 삼 넷 오 여섯 칠 팔 아홉 공‘은 포병과 무전병에게 필수다. 포병은 모든 숫자 읽기에 이것을 적용하는데, 이것을 실수할 경우 선임이 신참을 갈구는 좋은 요소가 된다. ㅋㅋㅋㅋㅋㅋㅋㅋㅋㅋㅋ (예를 들어 세 번째 물건을 ‘셋’이라 세는 경우, 개갈굼을 당한다. ㅋㅋㅋ) 지나고나서 하는 이야기지만, 갈굼 당하는 것 자체는 부조리이긴 하나, 이것을 체화하지 않으면 작전을 원활히 진행할 수 없으니 이해할 수 있다고 본다.

‘롱카운트’로 알파벳의 철차 하나하나를 일일이 원거리로 송신할 때, 혼동을 방지하기 위해 알파벳을 일일이 분해하는 음성기호를 사용한다. 어릴 때는 이것을 왜 외우는지 아무도 알려주지 않고, 이해도 되지 않았으므로 그냥 외웠지만, 지나고 보니 이것을 Phonetic Code라고 부르는 걸 알게 됐다. ㅎㅎㅎㅎ 좀 검색해봤는데, 역시나 나무위키에 밀덕이 많은건지 자세히 나와있다.[3] 쓸데없이 초 훌륭하네-_- 한국어의 음성기호가 있는 줄 처음 알았다. ㅎㅎ 내가 배운 영문 음성 기호는 NATO에서 쓰는 음성기호다. 당연한 이야기지만, 군사적 적대관계에 있으면 이 코드를 공유하지 않으므로 러시아는 별도의 코드[4]를 쓰는 듯 하다. 사실 러시아어에 대해 찾아보다가 나온거다.

아 이걸 보니 어릴 때, 군대에서 숏카운트로 개갈굼당하던-_- 추억이 생각난다. ㅋㅋㅋ 수학과 학생들은 포병되기 전에 좀 외워 두는 게 좋을 듯 ㅋㅋㅋㅋㅋㅋㅋㅋㅋ (총번, 군번등의 각종 숫자나열을 연습없이 숏카운트로 말할 수 있는 사람은 없을 듯 하다.)

영화 같은데서 무전신호로 알겠다는 의미로 roger라고 대답하는 것을 흔히 볼 수 있는데, 1956년 이전 음성기호는 r이 roger(현재는 romeo)이다. received의 의미로 ‘r’을 말하려고 roger가 된 듯 한데, 확실하지는 않다. 혹시 진위를 아시는 밀덕은 출처와 함께 댓글 함 주시면 감사하겠습니다. 자칭 밀덕이라는 사람들이 출처없는 정보를 남발하는 경우가 많아서… ㅎㅎㅎㅎㅎ

.


[1] 내 백과사전 나폴레옹이 포병이 된 이유 2012년 7월 12일
[2] 내 백과사전 데이터 분석으로 비교한 역사상 최고의 장군? 2018년 8월 19일
[3] 음성 기호 (나무위키)
[4] Russian phonetic alphabet (priyom.org)

catch-22의 의미

이코노미스트지 기사[1]를 읽다가 catch-22 라는 표현이 나오던데, 이게 뭔 뜻인가 싶어서 검색을 해 봤다. ㅎㅎ

Catch-22라는 소설이 있나 본데, 본인은 읽은 적이 없다. 한국어 위키피디아 항목이 별도로 있는 걸 보면 꽤 유명한 소설인 듯. 대충 내용을 짐작해보면, 집단 속에 존재하는 상호 모순적인 규정들 사이에서 방황하는 개인의 심리를 묘사하는 작품 같다. 국내에 역서[2,3]도 있다.

한편, 이 문구에 대해 위키피디아 항목이 별도로 있는 걸 보면, 나름 꽤 널리 쓰이는 상용구 같다. 모순적인 규정에 처한 개인의 곤란을 가리킬 때 쓰는 듯 한데, 이코노미스트지 기사[1]에서는 그냥 모순과 동의어로 사용하는 것 같다. 이 단어도 언젠가 dotard[4] 처럼 될지, 흥하게 될런지 두고봐야 할 듯 하다. ㅎㅎㅎ

contradiction, paradox, 딜레마, oxymoron, zugzwang, 내로남불 등등등 이상한 단어도 초 많은데 자꾸 단어를 더 보태는 구만. ㅋㅋㅋ 오늘도 상식이 늘어난 것 같아 기분 좋다. ㅎㅎ

.


[1] 이코노미스트 For emerging markets, a more fearful Fed is a less frightful one Jan 10th 2019
[2] 캐치-22 1 조지프 헬러 (지은이), 안정효 (옮긴이) | 민음사 | 2008-08-22 | 원제 Catch-22 (1961년)
[3] 캐치-22 2 조지프 헬러 (지은이), 안정효 (옮긴이) | 민음사 | 2008-08-22 | 원제 Catch-22 (1961년)
[4] 내 백과사전 미국인이 북한에게 배우는 영단어 dotard 2018년 1월 6일

최악의 알파벳 책 : P is for pterodactyl

일전에 A is for Array와 같은 책 이야기[1]도 했지만, 애들에게 알파벳을 알려주기 위한 Alphabet book의 종류가 무척 많은 듯 한데, 자칭 최악의 알파벳 책이라고 광고하는 책이 있는 듯 하다. 이름하여 ‘P is for pterodactyl'[2]이라고 한다. ㅎㅎㅎ

근데 이 책이 입소문을 타고 나름 엄청 팔린 듯 하다.[3] 진짜 실제로 애 한테 보여줄 사람이 있긴 있는감?? 그냥 단어 오타쿠가 좋아할 듯하다. ㅋㅋㅋ

가디언 기사[3] 중간에, B 묵음으로 시작하는 단어는 영어에서 오직 하나 뿐이다는 이야기가 나오던데, 이게 뭔 단어인가 싶어서 찾아보니 bdellium[4]이라고 한다.[5] 진짜 단어 오타쿠나 알만한 단어구만-_-

한편 pterodactyl이랑 pterosaur가 뭐가 다른가 싶어서 검색해봤는데, 카네기 자연사 박물관 홈페이지[6]에 따르면, 아무래도 pterodactyl는 pterosaur의 한 종류인 듯 하다. pterodactyl이라 하니, 트위터에서 예전에 본 개그[7]가 생각나는구만. ㅋ

ㅋㅋㅋㅋㅋ

.


2019.6.7

뭔 뜻인가 한참 생각했네-_- pee가 오줌이라는 뜻임. ㅋㅋ

.


[1] 내 백과사전 프로그래머의 자녀를 위한 그림책 : A is for Array 2013년 6월 1일
[2] P Is for Pterodactyl: The Worst Alphabet Book Ever (amazon.com)
[3] 가디언 P is for pterodactyl, T is for tsunami: the ‘worst alphabet book’ becomes a bestseller Mon 3 Dec 2018 07.00 GMT
[4] bdellium (dic.daum.net)
[5] Which word has a silent B at the start? [duplicate] (english.stackexchange.com)
[6] PTERODACTYL OR PTEROSAUR? (carnegiemnh.org)
[7] https://twitter.com/thenatewolf/status/685632235857408001

CIA의 한국어 사용자 구인광고

일전에 Vault 7 사건[1]과 관련하여, 프로그래머의 국적을 혼동시키기 위한 소스코드 obfuscation의 사례를 보여주는 기사[2]를 봤는데, 모국어가 한국어인 사람의 관점에서, CIA에는 고급 한국어 사용자가 없음을 확실히 알 수 있다. ㅎㅎㅎㅎ 맨날 북한을 염탐하면 뭐하나. 한국어를 모르는데-_-

여하간 CIA 내부에서 한국어 사용자가 꽤나 필요한 모양이다. CIA 트위터 계정에서 한국어 사용자 구인광고[3]를 하는 모양. ㅋ 석달 전의 트윗이긴 하지만 재미있어서 올려봄. ㅋ 첩보 관련 블로그인 Intel Today에도 관련 글[4]이 있다. 뭐 GCHQ에 취직하는 법[5]보다는 쉽지 않을까-_-

CIA 내부에서 언어학자들이 꽤 활동하는 모양인데, CIA에서 활동하는 언어학자 홍보 영상[6]까지 제작하는 걸 보면, 나름 해외 첩보에 이들의 활동이 적지는 않은 듯 하다.

그나저나 CIA의 공식 트위터 관리자는 첫 트윗[7]부터 개그를 치는 사람인데-_- 누구인지 얼굴 함 보고 싶구만-_- ㅋㅋㅋ

.


[1] 내 백과사전 위키리크스가 CIA가 만든 멀웨어와 해킹툴을 폭로하다 2017년 3월 8일
[2] the hacker news WikiLeaks Reveals ‘Marble’ Source Code that CIA Used to Frame Russia and China Friday, March 31, 2017
[3] https://twitter.com/cia/status/1030500705432494081
[4] CIA to Recruit Korean Speakers — Do you know your ABC? (gosint.wordpress.com)
[5] 내 백과사전 영국 첩보기관 GCHQ에 취직하는 법 2013년 9월 13일
[6] We are the linguists of the Central Intelligence Agency (youtube 58초)
[7] 내 백과사전 CIA의 공식 트위터 2014년 6월 10일

1860년대 이전의 회화에서 보랏빛이 드문 이유?

이코노미스트 에스프레소[1]에서 흥미로운 논문[2]을 소개하고 있던데, 나도 이에 관해서 왠지 블로그에 쓸 말이 많을 듯 하여 포스팅해봄. ㅋㅋ

Allen Tager라는 사람이 1860년대 이전에 그려진 139,892점의 회화 작품을 조사하여, 그 중 0.06%만이 violet을 이용했다고 주장하고 있다. violet은 19세기 들어 인상파 화가들에 의해 비로소 활발히 쓰이게 된 모양이다. 이코노미스트지[1]에 첨부된 이미지는 아마 모네의 작품 같은데, 무슨 작품인지는 잘 모르겠음.

갑자기 이 대목에서 violet과 purple의 차이가 궁금해지는데, 논문[2;p263]에서도 설명이 있고, 동일한 설명이 위키피디아 Violet 항목에도 있다. violet은 빛으로 만든 spectral color들 중에서 한 군데의 위치를 차지하는 단일 파장의 색을 가리키고, purple은 빨강과 파랑의 혼합색을 가리킨다고 한다. 뭐 한국어로서는 이 둘을 구별하지 않으니, 좀 와닿지는 않구만.

보라색이라 하니 Seth Godin의 ‘보랏빛 소가 온다‘라는 책[3]을 읽은 기억이 나는데, 책 내용 자체는 전통적인 광고전략이 아닌 독특한 점을 부각하는 입소문 마케팅을 활용하라는 내용의 경영서적이다. 위키피디아에 있는 이 아저씨 사진을 보니 보라색 넥타이를 매고 있던데, 보라색을 엄청 좋아하는 듯. ㅋㅋ 여하간 책 제목에서 함유하는 바와 같이, 보랏빛이 자연계에서 그리 흔치는 않은 색인 듯 하다. 그래서 옛날 화가들이 별로 안 썼을 수도 있을 듯 하다.

논문[2]의 저자는 이런 현상이 생기는 이유에 대해 세 가지 가설을 설명하고 있다. 첫째, 과거에는 보라색 염료가 귀했다. 둘째, 지구 환경이 변하여 생물군이 변했다. 셋째, 인간이 색을 인지하는 능력이 증대했다. 헐… 내가 보기에는 굳이 셋 중에 하나를 고르라면 첫째 설명이 가장 현실적이다-_-

일전에 읽은 언어학자 기 도이처 선생의 책[4]과 Neil Smith 선생의 책[5]이 떠오르는데, 색을 가리키는 단어가 문화권별로 계층화되어 있어, 점진적으로 생성된다는 Brent Berlin 선생과 Paul Kay 선생의 저서[6]에 나오는 이론이 소개되어 있다. 이 논문[2]에서도 그 책[6]을 언급하고 있다. 근데 진짜 이거랑 관련이 있긴 한가? violet이라는 단어가 19세기에 비로소 생겼으면 모를까. 지금 검색해보니 violet의 어원은 12세기 중세 프랑스어 violete 에서 왔다고 돼 있다.[7] purple은 9세기 라틴어 purpura에서 온 모양[8]이다.

뭐 여하간 일전에 과거 회화작품으로 대기오염을 추정하는 이야기[9]도 했지만, 미술관에서 회화작품 감상할 때, 뭔가 아는 척-_-하며 즐길 수 있는 썰(?)이 풍부해져서 좋긴 하다. ㅋㅋㅋ

.


2019.2.5
그냥 보라색 물감이 과거에는 비쌌다는 설명[10]이 더 설득력 있구만.

.


2019.4.2
Difference between ‘violet’ and ‘purple’ (jakubmarian.com)

.


[1] 이코노미스트 에스프레소 Kind of blue: science of colour Oct 27th 2018
[2] Tager, Allen. (2018). Why was the Color Violet rarely used by Artists before the 1860s?. Journal of Cognition and Culture. 18. 262-273. doi:10.1163/15685373-12340030.
[3] 보랏빛 소가 온다 – 광고는 죽었다 세스 고딘 (지은이), 이주형, 남수영 (옮긴이) | 재인 | 2004-02-28 | 원제 Purple Cow (2002년)
[4] 내 백과사전 [서평] 그곳은 소, 와인, 바다가 모두 빨갛다 : 언어로 보는 문화 2012년 5월 3일
[5] 내 백과사전 [서평] 언어, 바나나, 보노보 : 언어학의 문제와 퍼즐 그리고 논쟁 2012년 8월 16일
[6] Berlin, B., & Kay, P. (1969). Basic Color Terms: Their Universality and Evolution. Berkeley: University of California Press.
[7] violet (n.) (etymonline.com)
[8] purple (n., adj.) (etymonline.com)
[9] 내 백과사전 거장의 그림을 통한 과거 대기오염 측정 2014년 4월 10일
[10] Why is purple so rare a color in flags? (reddit.com)