catch-22의 의미

이코노미스트지 기사[1]를 읽다가 catch-22 라는 표현이 나오던데, 이게 뭔 뜻인가 싶어서 검색을 해 봤다. ㅎㅎ

Catch-22라는 소설이 있나 본데, 본인은 읽은 적이 없다. 한국어 위키피디아 항목이 별도로 있는 걸 보면 꽤 유명한 소설인 듯. 대충 내용을 짐작해보면, 집단 속에 존재하는 상호 모순적인 규정들 사이에서 방황하는 개인의 심리를 묘사하는 작품 같다. 국내에 역서[2,3]도 있다.

한편, 이 문구에 대해 위키피디아 항목이 별도로 있는 걸 보면, 나름 꽤 널리 쓰이는 상용구 같다. 모순적인 규정에 처한 개인의 곤란을 가리킬 때 쓰는 듯 한데, 이코노미스트지 기사[1]에서는 그냥 모순과 동의어로 사용하는 것 같다. 이 단어도 언젠가 dotard[4] 처럼 될지, 흥하게 될런지 두고봐야 할 듯 하다. ㅎㅎㅎ

contradiction, paradox, 딜레마, oxymoron, zugzwang, 내로남불 등등등 이상한 단어도 초 많은데 자꾸 단어를 더 보태는 구만. ㅋㅋㅋ 오늘도 상식이 늘어난 것 같아 기분 좋다. ㅎㅎ

.


[1] 이코노미스트 For emerging markets, a more fearful Fed is a less frightful one Jan 10th 2019
[2] 캐치-22 1 조지프 헬러 (지은이), 안정효 (옮긴이) | 민음사 | 2008-08-22 | 원제 Catch-22 (1961년)
[3] 캐치-22 2 조지프 헬러 (지은이), 안정효 (옮긴이) | 민음사 | 2008-08-22 | 원제 Catch-22 (1961년)
[4] 내 백과사전 미국인이 북한에게 배우는 영단어 dotard 2018년 1월 6일

최악의 알파벳 책 : P is for pterodactyl

일전에 A is for Array와 같은 책 이야기[1]도 했지만, 애들에게 알파벳을 알려주기 위한 Alphabet book의 종류가 무척 많은 듯 한데, 자칭 최악의 알파벳 책이라고 광고하는 책이 있는 듯 하다. 이름하여 ‘P is for pterodactyl'[2]이라고 한다. ㅎㅎㅎ

근데 이 책이 입소문을 타고 나름 엄청 팔린 듯 하다.[3] 진짜 실제로 애 한테 보여줄 사람이 있긴 있는감?? 그냥 단어 오타쿠가 좋아할 듯하다. ㅋㅋㅋ

가디언 기사[3] 중간에, B 묵음으로 시작하는 단어는 영어에서 오직 하나 뿐이다는 이야기가 나오던데, 이게 뭔 단어인가 싶어서 찾아보니 bdellium[4]이라고 한다.[5] 진짜 단어 오타쿠나 알만한 단어구만-_-

한편 pterodactyl이랑 pterosaur가 뭐가 다른가 싶어서 검색해봤는데, 카네기 자연사 박물관 홈페이지[6]에 따르면, 아무래도 pterodactyl는 pterosaur의 한 종류인 듯 하다. pterodactyl이라 하니, 트위터에서 예전에 본 개그[7]가 생각나는구만. ㅋ

ㅋㅋㅋㅋㅋ

.


[1] 내 백과사전 프로그래머의 자녀를 위한 그림책 : A is for Array 2013년 6월 1일
[2] P Is for Pterodactyl: The Worst Alphabet Book Ever (amazon.com)
[3] 가디언 P is for pterodactyl, T is for tsunami: the ‘worst alphabet book’ becomes a bestseller Mon 3 Dec 2018 07.00 GMT
[4] bdellium (dic.daum.net)
[5] Which word has a silent B at the start? [duplicate] (english.stackexchange.com)
[6] PTERODACTYL OR PTEROSAUR? (carnegiemnh.org)
[7] https://twitter.com/thenatewolf/status/685632235857408001

CIA의 한국어 사용자 구인광고

일전에 Vault 7 사건[1]과 관련하여, 프로그래머의 국적을 혼동시키기 위한 소스코드 obfuscation의 사례를 보여주는 기사[2]를 봤는데, 모국어가 한국어인 사람의 관점에서, CIA에는 고급 한국어 사용자가 없음을 확실히 알 수 있다. ㅎㅎㅎㅎ 맨날 북한을 염탐하면 뭐하나. 한국어를 모르는데-_-

여하간 CIA 내부에서 한국어 사용자가 꽤나 필요한 모양이다. CIA 트위터 계정에서 한국어 사용자 구인광고[3]를 하는 모양. ㅋ 석달 전의 트윗이긴 하지만 재미있어서 올려봄. ㅋ 첩보 관련 블로그인 Intel Today에도 관련 글[4]이 있다. 뭐 GCHQ에 취직하는 법[5]보다는 쉽지 않을까-_-

CIA 내부에서 언어학자들이 꽤 활동하는 모양인데, CIA에서 활동하는 언어학자 홍보 영상[6]까지 제작하는 걸 보면, 나름 해외 첩보에 이들의 활동이 적지는 않은 듯 하다.

그나저나 CIA의 공식 트위터 관리자는 첫 트윗[7]부터 개그를 치는 사람인데-_- 누구인지 얼굴 함 보고 싶구만-_- ㅋㅋㅋ

.


[1] 내 백과사전 위키리크스가 CIA가 만든 멀웨어와 해킹툴을 폭로하다 2017년 3월 8일
[2] the hacker news WikiLeaks Reveals ‘Marble’ Source Code that CIA Used to Frame Russia and China Friday, March 31, 2017
[3] https://twitter.com/cia/status/1030500705432494081
[4] CIA to Recruit Korean Speakers — Do you know your ABC? (gosint.wordpress.com)
[5] 내 백과사전 영국 첩보기관 GCHQ에 취직하는 법 2013년 9월 13일
[6] We are the linguists of the Central Intelligence Agency (youtube 58초)
[7] 내 백과사전 CIA의 공식 트위터 2014년 6월 10일

1860년대 이전의 회화에서 보랏빛이 드문 이유?

이코노미스트 에스프레소[1]에서 흥미로운 논문[2]을 소개하고 있던데, 나도 이에 관해서 왠지 블로그에 쓸 말이 많을 듯 하여 포스팅해봄. ㅋㅋ

Allen Tager라는 사람이 1860년대 이전에 그려진 139,892점의 회화 작품을 조사하여, 그 중 0.06%만이 violet을 이용했다고 주장하고 있다. violet은 19세기 들어 인상파 화가들에 의해 비로소 활발히 쓰이게 된 모양이다. 이코노미스트지[1]에 첨부된 이미지는 아마 모네의 작품 같은데, 무슨 작품인지는 잘 모르겠음.

갑자기 이 대목에서 violet과 purple의 차이가 궁금해지는데, 논문[2;p263]에서도 설명이 있고, 동일한 설명이 위키피디아 Violet 항목에도 있다. violet은 빛으로 만든 spectral color들 중에서 한 군데의 위치를 차지하는 단일 파장의 색을 가리키고, purple은 빨강과 파랑의 혼합색을 가리킨다고 한다. 뭐 한국어로서는 이 둘을 구별하지 않으니, 좀 와닿지는 않구만.

보라색이라 하니 Seth Godin의 ‘보랏빛 소가 온다‘라는 책[3]을 읽은 기억이 나는데, 책 내용 자체는 전통적인 광고전략이 아닌 독특한 점을 부각하는 입소문 마케팅을 활용하라는 내용의 경영서적이다. 위키피디아에 있는 이 아저씨 사진을 보니 보라색 넥타이를 매고 있던데, 보라색을 엄청 좋아하는 듯. ㅋㅋ 여하간 책 제목에서 함유하는 바와 같이, 보랏빛이 자연계에서 그리 흔치는 않은 색인 듯 하다. 그래서 옛날 화가들이 별로 안 썼을 수도 있을 듯 하다.

논문[2]의 저자는 이런 현상이 생기는 이유에 대해 세 가지 가설을 설명하고 있다. 첫째, 과거에는 보라색 염료가 귀했다. 둘째, 지구 환경이 변하여 생물군이 변했다. 셋째, 인간이 색을 인지하는 능력이 증대했다. 헐… 내가 보기에는 굳이 셋 중에 하나를 고르라면 첫째 설명이 가장 현실적이다-_-

일전에 읽은 언어학자 기 도이처 선생의 책[4]과 Neil Smith 선생의 책[5]이 떠오르는데, 색을 가리키는 단어가 문화권별로 계층화되어 있어, 점진적으로 생성된다는 Brent Berlin 선생과 Paul Kay 선생의 저서[6]에 나오는 이론이 소개되어 있다. 이 논문[2]에서도 그 책[6]을 언급하고 있다. 근데 진짜 이거랑 관련이 있긴 한가? violet이라는 단어가 19세기에 비로소 생겼으면 모를까. 지금 검색해보니 violet의 어원은 12세기 중세 프랑스어 violete 에서 왔다고 돼 있다.[7] purple은 9세기 라틴어 purpura에서 온 모양[8]이다.

뭐 여하간 일전에 과거 회화작품으로 대기오염을 추정하는 이야기[9]도 했지만, 미술관에서 회화작품 감상할 때, 뭔가 아는 척-_-하며 즐길 수 있는 썰(?)이 풍부해져서 좋긴 하다. ㅋㅋㅋ

.


2019.2.5
그냥 보라색 물감이 과거에는 비쌌다는 설명[10]이 더 설득력 있구만.

.


[1] 이코노미스트 에스프레소 Kind of blue: science of colour Oct 27th 2018
[2] Tager, Allen. (2018). Why was the Color Violet rarely used by Artists before the 1860s?. Journal of Cognition and Culture. 18. 262-273. doi:10.1163/15685373-12340030.
[3] 보랏빛 소가 온다 – 광고는 죽었다 세스 고딘 (지은이), 이주형, 남수영 (옮긴이) | 재인 | 2004-02-28 | 원제 Purple Cow (2002년)
[4] 내 백과사전 [서평] 그곳은 소, 와인, 바다가 모두 빨갛다 : 언어로 보는 문화 2012년 5월 3일
[5] 내 백과사전 [서평] 언어, 바나나, 보노보 : 언어학의 문제와 퍼즐 그리고 논쟁 2012년 8월 16일
[6] Berlin, B., & Kay, P. (1969). Basic Color Terms: Their Universality and Evolution. Berkeley: University of California Press.
[7] violet (n.) (etymonline.com)
[8] purple (n., adj.) (etymonline.com)
[9] 내 백과사전 거장의 그림을 통한 과거 대기오염 측정 2014년 4월 10일
[10] Why is purple so rare a color in flags? (reddit.com)

17회 국제 언어학 올림피아드 퀴즈 문제

17회 국제 언어학 올림피아드한국 외국어 대학교에서 개최될 예정[1]이라고 한다. 뭐 예전에 기출문제[2]를 보니, 본인은 접근조차 불허할 듯 하지만-_- 여하간 공지사항에 붙어 있는 퀴즈 문제는 재미있어서 카피해 봄. ㅋㅋㅋ

음… 술먹고 풀어서 그런지 단순한 연립방정식으로는 어택이 안 되는 것 같다. sora 어 처럼 독특한 기수법을 가진 게 아닐까 추측되는데, 도저히 모르겠음-_- 덴마크어 단어 halvfemsindstyve[3] 같은 건 아니겠지-_-

예전에 본 The Linguists라는 다큐멘타리[4]가 생각나는구만. ㅋㅋㅋ 여하간 언어학 올림피아드는 퀴즈조차 범상치 않구만-_- 좀 쉬운 걸로 주지-_-

.


2018.11.4
이누이트 숫자 QUIZ 정답 및 당첨자 (krlo.kr)

.


[1] 제17회 KLO 개최 안내 (edu.krlo.kr)
[2] 내 백과사전 2015 국제 언어학 올림피아드 결과 2015년 7월 24일
[3] 내 백과사전 프랑스인의 20사랑 2011년 11월 19일
[4] 내 백과사전 The Linguists(2008) 2015년 9월 28일

자연어 처리로 Voynich manuscript를 해독하기

갑자기 미야자키 이치사다 선생의 말[1]이 생각나는데, 고문서 해독은 당대의 언어와 문화 전반에 걸쳐 두루 꿰고 있지 않으면 불가능하다. 샹폴리옹이 고대 이집트 신성문자를 해독하는 과정에서 얼마나 많은 개고생-_-을 했는지, 일전에 읽은 Roy와 Lesley의 책[2]에 잘 나와 있다.

미해독된 고대 필사본들 가운데 가장 악명이 높은 것이 Voynich manuscript인데, 많이들 들어보셨을 터이다. 현재까지 해독이 되지 않고 있는 문서인데, 위키피디아를 보니 양피지의 방사선 탄소연대 측정으로 대략 15세기 초에 제작된 것으로 추정된다고 한다.

이 악명높은 고문서를 자연어 처리 기법으로 뚫어보려는 시도[3]가 있었는 듯 하다. 2016년 논문이라 좀 오래 됐는데, 나는 방금 봤으므로-_- 걍 포스팅 함. ㅋㅋㅋ

Alberta 대학 소속의 자연어 처리 연구자인 Greg Kondrak 선생이 Voynich manuscript를 해독하려고 시도한 모양인데, 무료로 논문을 볼 수 있다. 논문 앞쪽[3;p77]에는 암호해독의 정석 중의 정석인 frequency attack과 문자들 사이의 이산 거리 확률을 비교하는 시도를 한 듯 한데, 이렇게 오랫동안 해독되지 않은 문서에 그런 흔한 방법이 통할런지 의문이다. ㅎ

여하간 캐릭터 빈도 분석과 anagram 분석을 이용해서 통계적인 자연어 처리 방식으로 어느 언어인지 맞추기를 시도한 듯 한데, 세계 인권 선언에 들어 있는 380개 언어들과 비교한 결과 히브리 어일 가능성이 높다고 결론을 내린 듯 하다. 근데 위키피디아를 보니 유대인 매거진인 Mosaic에서 그럴리 없다고 주장[4]하는 듯. ㅋ 논문의 몇몇 가정이 매우 의심스럽다고 말하는 듯 한데, 뭐 본인은 히브리 어는 전혀 모르니 넘어갑시다. ㅋ

여하간 내가 보기에는 아무리 통계적 접근을 했다지만, 그 기반은 매우 잘 알려진 고전적 암호해독 기법인데, 히브리 어가 정말 정답이라면 과거 누군가는 히브리 어로 해독을 시도해 이미 풀렸을 가능성이 높을 듯 하다. 역시 고문서를 해독하기 위해서는 당대의 문화와 배경을 연결해야 가능하지, 문자만으로는 곤란하다고 본다. 문외한이 보기에도 꽤나 회의적인 결과가 아닐 수 없다. ㅎ

.


2018.9.15
voynich manuscript 보이니치 필사본 (jayhoonie.tistory.com)

.


[1] 오늘의 한마디(宮崎市定) (sonnet.egloos.com)
[2] 내 백과사전 [서평] 문자를 향한 열정 : 세계 최초로 로제타석을 해독한 샹폴리옹 이야기 2012년 7월 14일
[3] Hauer, B., & Kondrak, G. (2016). Decoding Anagrammed Texts Written in an Unknown Language and Script. Transactions Of The Association For Computational Linguistics, 4, 75-86. Retrieved from https://transacl.org/ojs/index.php/tacl/article/view/821
[4] Mosaic No, the Mysterious Voynich Manuscript Is Not Written in Hebrew FEB. 7 2018

유니코드에 출몰하는 유령 : 유령한자

해커뉴스[1]에서 흥미로운 이야기[2]를 들었다. ㅋㅋ

1978년 일본의 경제산업성에서 일본어 문자코드인 JIS X 0208을 제정할 당시, 일부 출처도 알 수 없고 실제로 거의 쓰이지도 않는 한자 수십 개가 포함되었는데, 이를 ‘유령문자‘라고 부르고 있는 듯 하다. 나무위키[3]에도 항목이 있다.

이 한자들은 주요문서에 나와 있지 않는 한자이므로, 의미가 불명하고 읽는 방법도 아는 사람이 없었다고 한다. 문제는 이 한자들이 그대로 유니코드에 등록되어 현재 유니코드 목록에도 남아있다는 점이다.

꽤 오랜 기간동안 이 한자들은 설명되지 않고 잊혀진 채로 남아있었는데, 1997년 대대적인 조사를 착수하여 상당수는 출처를 찾아내는 데 성공한 모양이다. 다만 최후로 남은 12개의 한자는 그 어느 문헌에서도 찾지 못한 한자라서 발음과 의미가 불명인 상황이라고 한다. 일본 위키피디아 유령문자 항목에 12개의 목록이 나열되어 있다.

재미있는 한자는 ‘妛’ 인데, 카탈로그를 제작한 사람과 인터뷰를 하여 조사한 결과, 본래 존재하는 한자인 𡚴자를 전산화하는 과정에서, 山자와 女자가 각각 인쇄된 종이로 잘라 붙여 복사할 때, 가로선이 삽입되어 탄생한 한자라고 한다. 덕분에 진짜 올바른 한자 ‘𡚴’자는 한참후에 유니코드에 등록될 수 있었다고 한다.

12한자 중 11자는 어떤 이유로 실수했는지 대략적인 추정이 되고 있으나, 최후의 마지막 한자인 ‘‘는 어떤 문헌에서도 나타나고 있지 않기 때문에, 의미도 발음도 불명확한 가장 미스테리한 한자가 돼 버렸다고 한다. 나무위키에 별도의 항목[4]이 있다. 일본어 위키피디아의 설명대로, 좁은 의미로는 유령한자는 이 한자 뿐이라고 말할 수도 있을 것이다.

.


[1] A Spectre is Haunting Unicode (hacker news)
[2] A Spectre is Haunting Unicode (dampfkraft.com)
[3] 유령 문자 (나무위키)
[4] (나무위키)

네이티브가 자국어 시험 치기

유튜브에서 어학 관련 영상을 자꾸보니, 유튜브에서 요상한 영상을 자꾸 추천한다-_-

일전에 아랍인이 수능 아랍어 문제 푸는 영상[1] 이야기를 했는데, 네이티브가 자국어 시험 치는 영상을 좀 찾아봤다. 참고로 술먹고 보면 재미가 두 배다 ㅋㅋㅋ

10분 29초

11분 16초

4분 57초

10분 32초

8분 4초

3분 48초

뭐 진지하게 푼다기 보다는, 재밌게 영상을 만들려고 (영상 제작자에게 구독자 숫자는 필요하다ㅋ) 일부러 과장하는 느낌도 없지 않으니, 그걸 감안하고 보아야 할 듯 하다. 여하간 보니까 재밌어서 올려봄. 10분 32초짜리 영상은 진짜 진짜 웃기니까 꼭 보삼. ㅋㅋㅋㅋㅋㅋㅋㅋㅋㅋ

.


[1] 내 백과사전 아랍인의 수능 아랍어 도전 ㅋㅋㅋ 2018년 3월 24일

영어의 전치사는 어렵다

다른 로망스어군이 그러하듯 프랑스어 명사에도 (gender)이 있는데, 얼마전에 프랑스어 명사의 성평등-_-을 주장하는 프랑스 교사들의 운동에 대한 기사[1]를 본 적이 있다. ㅋㅋㅋ 아랍어에도 남/여 성이 있지만, 대부분의 어휘는 타 마르부타 때문에 구별이 쉽다. (수능 아랍어에도 타 마르부타만 잘 확인하면 맞출 수 있는 문제가 좀 있음. ㅋㅋ) 러시아어를 포함하는 슬라브어군에는 남성/여성/중성까지 있어 더욱 빡시다. ㅋ

여하간 본인은 프랑스어를 모르지만, 성은 프랑스어를 배우기 까다롭게 만드는 요소중의 하나라고 들었다. 많은 언어에는 외국인들이 익히기 어려운 요소가 하나씩 있는데, 이코노미스트지의 기사[2]를 보니 중국어에는 성조, 일본어에는 높임법, 독일어는 관사, 러시아어는 격변화, 덴마크어는 발음이라고 한다. 다른 건 잘 몰라도 러시아어 격변화는 나름 공감한다-_-

그럼 영어에는?? 인도-유럽어족 사람들이 영어를 배울 때 어려운 점은 아무래도 전치사인 듯 하다. 이코노미스트지[2]에 나온 예시가 on the train인데, 논리적으로 in the train이 맞는거 아닌가? 다른 인도-유럽어족 사람들은 자기네 언어에서 in the train이라고 쓰는 모양이고, on the train이라 쓰면 기차 지붕 위에 앉은 모습을 상상하게 되는 듯 하다. ㅋㅋㅋㅋ 게다가 탈 것 중에서 자동차만은 예외로 in the car라고 쓰고 있으니 영어 전치사의 해괴함은 끝이 없다. 게다가 기사[2] 뒤쪽에 영국식/미국식 영어의 전치사도 좀 다르다는 이야기도 나오던데, 뭐 한국인으로서는 영어의 전치사만 힘든게 아니라서-_- 별로 공감이 안된다. ㅋㅋㅋ 5개의 전치사 호응이 되는 문장[3]을 보면 전치사의 선택의 문제가 아닐 듯. ㅋ

트럼프가 bigly라는 문법에 맞지 않는 어휘를 써서 까였다는 이야기[4]를 들은 적이 있는데, 맞춤법에 맞지 않는 표현을 쓰면 책을 별로 안 읽은(즉 별로 공부를 안한) 티가 나니까, 왠지 무시하고 싶어지는-_- 느낌이 없지 않다. ㅋ 그래서 의미/의도 전달보다 쓸데없이 정서법에 집착하게 되고, 뭐 그런 부작용도 있는 듯 하다. 자기의 의견을 전달할 때는 맞춤법을 신경쓰고, 남의 틀린 맞춤법에는 열린 마음으로 넘어가주는 아량이 필요한게 아닌가 하는 생각이 든다. ㅎ

 


[1] 이코노미스트 Language activists are trying to make French gender-neutral May 17th 2018
[2] 이코노미스트 Deal with it Apr 9th 2015
[3] 내 백과사전 5개의 전치사로 끝나는 문장과 문장의 호응 2011년 8월 6일
[4] ‘Win Bigly’ – 설득의 대마왕이 되는 법 (트럼프처럼) (blog.naver.com/indizio)