Зачем в наше время еще переводить вручную?
Если я увижу текст на незнакомом языке и захочу узнать, что там написано, я быстренько скопирую его в программу, доступную онлайн, или нажму на имеющуюся в самом приложении ссылку перевести
— и вот, текст уже видно на русском. Где проблема?
Как выглядит результат машинного перевода?
Есть электронные переводчики получше и похуже. Менее качественные чаще всего выдают некую словесную кашу, из которой можно угадать примерный смысл исходного текста, если повезет. Качественные предоставляют, как правило, результаты с правильной грамматикой и зачастую даже с адекватной стилистикой. Только нельзя полагаться на то, что смысл соответствует смыслу оригинала. Зачастую отдельные куски информации опускаются или заменяются. Бывает даже, что на выходе утверждается ровно обратное.
Правда, качество зависит не только от используемой программы. Оно очень сильно зависит и от исходного и целевого языков, а также от тематической области. Чем больше (хороших) переводов уже имеется, тем лучше получается автоматический перевод. Кроме того, наилучшие переводы достигаются в случае текстов, содержащих много специальных терминов. Такой термин обычно может и должен переводиться в тексте всегда одинаково. Это видно и по тому, как разные люди и программы здесь создают очень похожие или даже совершенно одинаковые переводы: Reihenmotoren haben meist zwei Nockenwellen
— In-line engines usually have two camshafts
— Рядные двигатели обычно имеют два распределительных вала
.
Но теперь пару примеров неверных машинных переводов!
Меряние зарплатами
Если перевести на немецкий язык высказывание
Хоть я и зарабатываю втрое меньше вас, но без вас мы обойдемся.
— то буквальный перевод втрое меньше
как dreimal weniger
будет выглядеть неграмотно. Лучше использовать выражение ein Drittel
— треть
. Например, можно сказать: Ich verdiene zwar nur ein Drittel von dem, was Sie verdienen, aber ohne Sie könnten wir auskommen
.
Однако DeepL, онлайн-переводчик с хорошей репутацией, выдает:
Auch wenn ich dreimal so viel verdiene wie Sie, kommen wir ohne Sie aus.
Вместо втрое меньше
получается втрое больше
!
Однако если чуть расширить предложение таким образом:
Хоть я и зарабатываю втрое меньше вас, но без вас мы обойдемся, а без меня никак.
— то машина вдруг говорит:
Auch wenn ich dreimal weniger verdiene als Sie, können wir auf Sie verzichten, aber nicht auf mich.
Теперь она перевела втрое меньше
слишком буквально, но хотя бы понятно. Поняла наконец...
Нет, естественно, машина ничего не поняла
, просто взяла другие тексты в качестве образцов. Но как мы сейчас увидим, нельзя полагаться на то, что добавление контекста всегда будет гарантировать более точного перевода.
Поцелуи посреди чата?
Чмоки всем в этом чатике!
Не сразу приходит на ум хороший немецкий перевод слова чмоки
. Хоть и употребляется уменьшительная, скорее ласкательная, форма слова чат
— которой в немецком просто нет аналога — но все-таки близость не такая, чтобы сразу раздавать поцелуйчики
.
DeepL переводит чмоки всем
как
xoxo an alle
XOXO: объятия и поцелуи (англ. hugs and kisses). Буква X символизирует поцелуй, буква O — пару рук, заключающих другого человека в объятия.
Ух ты, это в точку! Именно так пишут в чатах. Программа гениальна! А теперь... дополняю предложение (все еще начиная со строчной буквы и заканчивая без восклицательного знака) и получаю:
mitten in diesem Chatroom
— что означает попросту посреди этого чата
. Chatroom
— это, кстати, хорошая идея. Но куда делось приветствие?
А теперь ставлю восклицательный знак.
smoochie an alle in diesem Chatroom!
Что, скажите на милость, такое smoochie
? Или новое поколение немецких чатующихся уже придумало такое новое приветствие?
И, наконец, заменяю первую букву на заглавную — и получаю следующий результат:
Mwah! Mwah! Mwah! Mwah! Mwah! Mwah! Mwah!
Ну вот! Без комментариев...
Что умеет искусственный интеллект?
Если обобщать, то две вещи:
- соблюдать правила и
- имитировать поведение людей.
Отрабатывать алгоритмы, т.е. следовать заданным правилам — это вообще то, что делают все компьютерные программы, это основа их работы. Если исходить из этого, то удивительно, что грамматика в машинных переводах обычно бывает правильной только в тех случаях, когда программа очень тщательно настраивается на выполнение второго компонента — т.е. в данном случае на анализ и использование существующих текстов. Видимо, правила живого языка слишком комплексны для того, чтобы задавать их в качестве устойчивого свода правил.
Но ведь именно это — соблюдать правила и повторять за другими — делаем и мы, когда переводим, и вообще когда говорим! Чего именно тогда искусственный интеллект не может делать?
Программа не может понимать, что имеется в виду.
Правильная грамматика и хороший стиль в принципе не позволяет передавать каждое отдельное слово. И человек при хорошем переводе опускает отдельные понятия — но он в таком случае знает, что речь идет не о важных, смыслеобразующих понятиях. Так, например, всякий знает, что good afternoon
означает добрый день
, а не доброе время после полудня
.
Человек в состоянии образно представить себе смысл высказывания, а может быть, и нарисовать схему содержания, не используя слов. И человек знает, что именно на такой картинке важно или неважно. Вместо фразы рядные двигатели обычно имеют два распределительных вала
можно с таким же успехом сказать у рядного двигателя обычно есть два распредвала
. Множественное число в этом случае не влияет на смысл, человек представляет себе один двигатель как образец многих. Точно так же, при фразе good afternoon
видишь фигурку, вежливо здоровающуюся, зная при этом на задном плане, что время от 12 до 17 часов дня.
А в случае с чмоки
— кого-то из молодежи, скорее всего девушку, входящую в любимый чат и желающую сердечно приветствовать своих друзей.
Но и люди делают ошибки!
Это правда. Люди даже делают много опечаток и других ошибок по небрежности, которые не случились бы у такой программы. Кроме того, люди, у которых мало опыта, склонны коверкать грамматику целевого языка (даже если это их родной язык!), чтобы оставаться ближе к оригиналу (смотри втрое меньше
на немецком). А если человек спешит, то вполне может неправильно прочитать исходний текст и, как и машина, перепутать большую и меньшую зарплату.
Но у профессионального переводчика есть лингвистическое образование, и он, зная о таких возможных ошибках, еще неоднократно перечитывает готовые тексты, ища разные виды ошибок — и, не в последнюю очередь, он умеет пользоваться теми же электронными помощниками, начиная с простой проверки правописания и вплоть до специальных программ для переводчиков, помогающих, например, всегда видеть нужные специальные термины, а также исходный и целевой текст одновременно. А тут могут вступить в игру и машинные переводы в качестве источников идей (ключевое слово xoxo
).