티스토리 뷰

Review/IT

Languages used on the Internet

하이바네.P 2012. 9. 3. 20:07

요즘 NGO 단체에서 다국어로 사이트를 구축하는 프로젝트에 참여하고 있습니다.


그러다보니 internationalization (I18N) 관련 자료를 꽤 많이 접하고 있습니다.


대수롭지 않게 웹은 대부분 영어자료겠지 하고 생각했는데, 최근에 재미있는 자료를 접하게 되었습니다.





일단 우리나라가 상위 10% 안에 들었다는 것도 재미있지만, 역시 중국이 폭발적인 잠재력을 갖고 있는 것이 보입니다. 영어어를 사용하는 사람들에 비해서 중국어를 사용하는 사람들이 막상막하인 것을 볼 수 있습니다. 2011 년 자료긴 하지만, 생각보다 순수 영어권 사람의 %가 많지 않아서 놀랐습니다.





위 자료는 컨텐츠 들이 어떤 언어로 구성되어 있는지를 나타내는 도표인데요, 아주 다양합니다. 히브리어도 있고, 제가 알 수 없는 언어들도 0.1% 들로 나와있군요. 역시 가장 많은 %를 차지하는 것은 영어로 된 컨텐츠 입니다. 그런데 이것도 %로 보면 약 57% 정도 라서 생각보다 낮은 수치였습니다. 보통 생각하기엔 체감상 70% 이상은 되어보이는 것 같은데 말이죠.


여기서 느낄 수 있는 것은 두 가지 정도 일 것 같습니다.

1. 아직 웹은 영어 위주로 정보가 공유되고 있다.

2. 국제화 관련 이슈가 앞으로 충분히 나올 수 있다.


 안타까운 이야기 이지만, 한국의 상황을 이에 비추어 본다면 어떨까요? 실제 글로벌 서비스의 경우 (트위터, 페이스북) 개별 지역언어 지원이 빠르게 되고 있습니다만, 국내의 경우 관공서를 예로 들자면 기껏해봤자 영어/중국어/일본어 정도밖에 되지 않는 것 같습니다. 점점 우리나라도 주한 외국인들이 2011년 12월 기준(통계청자료)으로 130만명이 넘어서고 있는데, 이에 대한 논의가 IT 산업에선 본격적으로 이루어지지 않고 있지 않나 싶습니다.


 루비온레일즈나 장고 같은 웹 프레임웍에서는 이러한 국제화 부분이 굉장히 잘 되어 있어서 작업하는데 도움이 많이 되었습니다. localizing 태그를 넣는 부분이 노가다이긴 하지만, 번역본을 만들고 대본 파일을 스크립트로 자동화 해서 넣으면 훨씬 시간이 단축되더군요. 이런 작업들을 집단지성을 발휘하여 적용하는 프로젝트들이 활성화된다면 진정한 OpenSource 의 길이 열리지 않을까 싶습니다.



출처 http://en.wikipedia.org/wiki/Languages_used_on_the_Internet