
- Переводы, Интересное
- 01/12/15
Машинный перевод: 60 лет спустя
Шестьдесят лет назад ученые из Джорджтауна и разработчики компании IBM впервые запустили «электронный переводческий мозг». Система успешно выдала перевод с русского на английский, на основании чего создатели уникальной машины заявили, что в ближайшие несколько лет человечество сможет полностью переложить переводческие трудности на могучие плечи новейшей техники.
С тех пор прошло шесть десятилетий, машинный перевод стал довольно распространенным явлением, однако полностью положиться на него мы все равно не можем. А ученые по-прежнему твердят, что «осталось всего несколько лет», и машины научатся переводить грамотно. Только вместо IBM флаг с девизом «Электронный перевод – это просто!» несет теперь Google.
А просто ли? Весьма смелое заявление. Еще в 1950-х гг. инженеры признавали, что для перевода всего одного небольшого фрагмента текста требуется в два с половиной раза больше команд, чем для запуска управляемой боевой ракеты. Сегодня, даже несмотря на новейший метод машинного перевода, основанный на векторно-пространственных математических моделях, результаты оставляют желать лучшего.
Новые технологии
До недавнего времени статистический метод работы электронных переводческих систем вполне неплохо справлялся с поставленной задачей. Конечно, чем больше собрано данных, тем точнее и качественнее будет перевод. Но что делать, если данных недостаточно? Или, если речь идет о Google, что делать, если данные находятся где-то на внешних платных или закрытых ресурсах? Ведь к ним у программы доступа нет.
Новые технологии решают эту задачу. Векторно-пространственный метод хорошо дополняет (но ни в коем случае не заменяет!) статистический подход к машинному переводу. Его суть заключается в автоматизированном создании словарей и фразовых таблиц. Этот процесс идет полностью без участия человека. Параллельно со сбором данных идет сравнение структур различных языков, затем программа генерирует таблицы с устойчивыми фразами и словари. Это означает, что система больше не полагается на документы, размещенные в сети на двух языках, чтобы улучшить качество перевода. Правда, как и любая другая методика, новая разработка имеет свои ограничения, над устранением которых придется еще подумать.
Сколько еще ждать?
Что интересно, каждые несколько месяцев жадные до сенсаций и громких заголовков журналисты объявляют о начале новой эры машинного перевода, о новых фундаментальных разработках, которым на самом деле уже больше 60 лет. Как правило, подобные заявления сводятся к одной сакраментальной фразе «Проблема перевода решена!».
К сожалению, приравнивать наши скромные достижения в машинном переводе к полному решению данной проблемы не совсем верно. Примерно так же мы можем сказать, что раз один человек когда-то побывал на Луне, то теперь любой из нас может собрать чемодан и слетать туда на выходные. На самом же деле мы можем вообще никогда больше туда не попасть. Но это не значит, что не стоит продолжать работу в этом направлении.
Машинный или электронный перевод по праву можно назвать техническим чудом. Он действительно позволяет решить многие важные задачи и облегчает жизнь людям, которым надо быстро понять примерное содержание текста или беседы. Нужно только понимать, когда и как его следует использовать.