
- Переводы, Интересное
- 10/09/15
Компьютер расшифровал неизвестный науке язык
Сегодня услуги перевода стали довольно распространенным явлением. В агентства переводов несут самые разные документы. Но есть область, в которой работают настоящие фанаты своего дела. Они выполняют, например, технический перевод на французский исключительно ради заработка, а свободное время посвящают расшифровке древних манускриптов. Мы расскажем вам, как было раскрыто содержание одного из древнейших манускриптов.
В последний раз угаритский язык звучал на нашей планете около 3 500 лет назад. О его существовании мы знаем лишь благодаря нескольким табличкам, для прочтения которых не одному поколению переводчиков потребовались годы кропотливой работы и много банальной исследовательской удачи. Пока в игру не вступили современные технологии, и компьютерная программа не расшифровала древние записи за считанные часы.
Алгоритм расшифровки
Программное обеспечение работает на нескольких основополагающих принципах, которые позволяют ему интуитивно распознавать структуру языка. Самый важный из результатов заключался в том, что у мертвого языка нашелся достаточно известный и изученный «собрат» — иврит. Во-вторых, в алфавитах обоих языков были выявлены совпадения по отдельным символам. А раз эти языки оказались родственными, то наверняка найдутся в них схожие слова и морфемы.
Конечно, на первой стадии программа выдала важную и полезную информацию, но для полной расшифровки скрижалей этого явно недостаточно. Обнаруженный еще в 1929 г., угаритский язык на протяжении десятилетий оставался непереводимым. Однако древние манускрипты приоткрыли свои секреты немецкому криптографу и языковеду-любителю Хансу Бауэру, который предположил, что символы, стоящие рядом с картинкой похожей на топор, как раз и означают слово «топор». Однако не все оказалось так просто! Бауэру удалось соотнести далеко не все понятия. Кроме того, он перепутал буквы и звуки, результатом чего стал совершенно неправильный и бессвязный перевод.
Так что перед компьютерной программой стояла задача не только и не столько опередить своих соперников-людей, сколько избежать ошибок и путаницы, значительно замедливших расшифровку на первом этапе. Машина работала на поиск соответствий и соотношений на разных уровнях обоих родственных языков. Затем все найденные соответствия были наглядно отмечены графически как в иврите, так и в угаритском языке. Благодаря такому перекрестному сравнению различных языковых единиц, а также многократному повторению этого процесса, ПО и выдало расшифрованный результат.
Так что же это было?
Сведения поразили ученых. Из 30 букв угаритского алфавита машине удалось правильно идентифицировать 29! Около трети угаритских слов имели ту или иную степень сходства с ивритом. Программа выявила около 60% сходных элементов. Результаты эти сами по себе весьма облегчили ученым задачу дешифровки, хоть программа и не разбирает ключевые моменты общего контекста. То есть машинному разуму не под силу воспринимать контекстные различия угаритских слов. Он не различает значения слова «дочь» и «дом», состоящих из одних и тех же символов. Но к счастью на это есть люди, легко исправляющие подобные ошибки исходя из контекста.
Угаритский язык оказался совершенно потрясающим явлением с точки зрения языкознания. Около 3 500 лет назад на нем говорили жители города Угарит, чьи руины лежат на территории современной Сирии. Он принадлежит к группе семитских языков и имеет общие корни с ивритом, хотя его алфавит больше напоминает шумерскую клинопись. Обнаруженные и с таким трудом расшифрованные угаритские тексты оказались ни много ни мало, а историей ханаанской религии. Будучи очень сходной (но не идентичной) с записями Ветхого Завета, эта информация позволила ученым более глубоко исследовать историю создания Библии, культуру древнего Израиля и его соседей.