Не каждый человек может написать своё имя в Юникоде

Не каждый человек может написать своё имя в Юникоде

497

Казалось бы, в Юникод включили уже все вероятные и неосуществимые знаки. В крайней версии Unicode 7.0 добавлено 23 новейших письменности , включая древнепермское письмо и практически на сто процентов расшифрованное линейное письмо А минойской цивилизации 2000 г до н.э., сотки экзотических эмотиконов.

Им приходится прибегать к различным трюкам. Оказывается, это не так. Казалось бы, там уже есть все всераспространенные знаки. Общее количество знаков в Unicode превысило 110 000 штук. До сих пор остались люди, которые не могут написать в Юникоде даже собственное имя.

О собственной дилемме поведал индийский IT-спец, имя которого мы не можем верно напечатать, разве что в транслитерации: Адитья Мукереджи.

Вы сможете представить, что не все знаки российского языка представлены в Unicode? Родной язык парня — бенгальский, это седьмой по популярности язык в мире, который существенно опережает по численности носителей даже российский. А вот для бенгальского это обычное дело.

Бенгальские знаки

Так, его собственное имя можно написать со сходной графемой из схожей письменности: আদিত্য. Бенгальский представлен в Unicode с самой первой версии, но с самого начала в нём не хватало знаков. Жителям страны приходилось изобретать велики, восполняя недостающие знаки при письме комбинациями схожих букв и цифр, как в хакерском l33tspeak.

Отсутствующая буковка

В его имени до сих пор не хватает буковкы, хотя оно — совсем не какая-то экзотика, а повсеместно встречается в Индии и даже заходит в 1000 самых фаворитных имён в США. В 2005 году некие знаки добавили, но не все.

Смелый спец даже делает расистские намёки. Дерзость можно осознать: он как продвинутый юзер цифровой техники много уже натерпелся за свою жизнь из-за «неудачного» имени. Адитья Мукереджи винит в технической некомпетентности служащих консорциума Unicode, которые занимаются подготовкой эталона. По его мнению, посреди служащих очень много белоснежных англоговорящих людей.

Адитья боится, что консорциум Unicode не собирается изменять перечень из 224 024 знаков, которые планируется включить в Unicode в наиблежайшие годы.

habrahabr.ru Эта история представляется ещё и увлекательным примером того, что современные технологии могут не лишь упростить жизнь, но и осложнить её.