Безопасная транслитерация

Большинство современных таблиц транслитерации (в том числе и таблица государственного стандарта ГОСТ 7.79:2000) обладают существенным недостатком: обратное преобразование из латиницы в кириллицу невозможно выполнить однозначно без использования дополнительных словарей. Например, слово «схоластика» при преобразовании по вышеупомянутой таблице ГОСТа превращается в «sholastika». Однако обратное преобразование заходит в тупик: то ли «шоластика», то ли «схоластика». Естественно, интуитивно человек, обладая своим словарным запасом, догадается, что речь идёт о «схоластике» (слова «шоластика» попросту нет в русском языке). Но как научить этому машину? Словарь всегда конечен, а возможности словообразования русского языка воистину огромны.

Основная причина подобной проблемы заключается в том, что почти все таблицы транслитерации являются префиксными. Это значит, что в них присутствует код буквы, с которого начинаются коды других букв. К примеру, код кириллической буквы «с» — латинская буква «s». Но с неё же начинается код другой буквы! В нашем примере это буква «ш». Её код — сочетание латинских букв «sh». При разборе транслитерированного текста возникает неоднозначность: как интерпретировать сочетание «sh»? Как «сх» или как «ш»?

Предлагаемая таблица избавлена от подобных недостатков. При разборе текста неоднозначностей не возникает, поскольку таблица беспрефиксная. Для разрешения споров призваны символы «c» и «y» латинского алфавита. Как видно из таблицы, самостоятельно они не означают ни одной буквы, а используются только в сочетаниях. Это устраняет неоднозначность. Исключение составляют буквы «ъ» и «ь», поскольку мне ещё не были известны случаи совместного использования этих букв в русских текстах. Тем более, я ярый сторонник объединения этих букв в один общий «знак»!

Естественно страдает удобочитаемость! Это вызвано тем, что стандартная транслитерация основана, как правило, на чтении звуков в английском языке («sh» — «ш»). Было бы наивно полагать, чтобы язык был точно математически выверен. У него свои законы.

Основная проблема таблицы — в чтении букв «ё», «й», «ц», «ш», «щ», «ы», «э». Обычно все принципы транслитерации кириллицы и спотыкаются на этих буквах. Для особо пунктуальных и педантичных параноиков проблема с буквой «ъ» легко решается заменой её знаком «^» или «q», сочетанием «c'» или «y'» или любым другим, удовлетворяющим правилу беспрефиксности для этой таблицы. Опять-таки, в ущерб удобочитаемости!

Таблица составлена методом мозгового штурма. Штурмовики:

КириллицаЛатиница
аa
бb
вv
гg
дd
еe
ёyo
жj
зz
иi
йyi
кk
лl
мm
нn
оo
пp
рr
сs
тt
уu
фf
хh
цcc, cz
чch
шcsh
щcch
ъ''
ыyy
ь'
эye
юyu
яya

Свои предложения можете высказать, связавшись с авторами.


© Максименко Ал 01.02.2007