어휘 기반의 정치적 성향 판정

미국과 같은 사실상의 양당제에서는, 양쪽 정당이 강한 지지율을 어느 정도 확보하고 있기 때문에 부동표의 방향에 따라 선거의 승패가 좌우된다. 민주당의 관점에서는 확고한 공화당 지지자의 설득을 포기하고, 표를 줄 듯한 중도 성향의 지지자에게 역량을 쏟는 것이 유리하다. vice versa. 오바마 선거팀에서 이러한 방법으로 사람의 정치적 성향을 빠르게 분류하여 선거의 승기를 잡았다고 어디서 들었는데, 출처가 생각이 안난다-_-

capitol words라는 비영리 단체가 국회에서 정치인들이 하는 모든 발언을 검색 가능한 텍스트화 하는 모양인데, 다음 사이트에서 직접 검색이 가능하다. 미국은 이런게 잘 돼 있어서 좋아.

http://capitolwords.org/

여하간 이 텍스트 데이터를 바탕으로 사람의 정치적 성향 분류를 알고리즘으로 가능한 지에 대한 연구가 진행중인 것 같은데, Quorum이라는 선거전략 회사가 데이터 과학자를 동원하여 이런 연구를 하는 모양.

nextgov COMPUTERS CAN TELL REPUBLICANS FROM DEMOCRATS BASED ON HOW THEY TALK July 24, 2015

quorum은 정족수라는 뜻인데, 이런 단어를 처음 알았다-_- 여하간 이런 회사도 있구나. 미국에는 별의별 회사가 다 있구만.

그래서 공화당원이 많이 쓰는 단어는 다음과 같다고 한다.
Bureaucrats, Obamacare, Job creators, Raise taxes, Mandates, IRS, Illegally, Stimulus, Promises, Liberal, Obama administration, Burdensome, Government spending, American energy, Amnesty

민주당원은 다음 단어를 많이 쓴다고 한다.
Wealthiest, Tax breaks, Republican colleagues, Minimum wage, Climate change, Comprehensive immigration, Tax cuts, Pollution, Unemployment insurance, Republican budget, African-American, Republican leadership, Equality, Working families, Middle class

이런 알고리즘이 정교해지면, 나중에는 글 몇 줄만 써도 사람의 정치 성향이 탁 나올 것 같은데, 이거이거 독재자들이 좋아할만한 거 아닌가 모르겠다-_-

답글 남기기

아래 항목을 채우거나 오른쪽 아이콘 중 하나를 클릭하여 로그 인 하세요:

WordPress.com 로고

WordPress.com의 계정을 사용하여 댓글을 남깁니다. 로그아웃 / 변경 )

Twitter 사진

Twitter의 계정을 사용하여 댓글을 남깁니다. 로그아웃 / 변경 )

Facebook 사진

Facebook의 계정을 사용하여 댓글을 남깁니다. 로그아웃 / 변경 )

Google+ photo

Google+의 계정을 사용하여 댓글을 남깁니다. 로그아웃 / 변경 )

%s에 연결하는 중