SoftMaker logo

Байты и не только

DeepL: новый золотой стандарт машинных онлайн-переводов?

Время от времени мы оказываемся в ситуациях, когда знание иностранного языка очень бы нам пригодилось: перед отпуском, когда хотелось бы уточнить последние деталях у хозяина арендуемого домика; на работе, когда приходит запрос из-за рубежа; дома, когда новое устройство или гаджет поставляются только с руководством на непонятном языке.

В таких случаях может помочь онлайн-сервис компании, базирующейся в Кельне, Германия: DeepL переводит тексты почти так же, как это сделал бы человек. Эта статья подробно расскажет вам о том, как и почему достигаются такие результаты.

Трудности перевода

Многие переводы, выполненные компьютерами, очень плохие: в автоматически переведенных инструкциях по эксплуатации много ошибок («связать пневматический насос с матрасом»), а в рецептах лапши быстрого приготовления часто встречается непостижимая тарабарщина.

Но так не должно быть: немецкий сервис переводов DeepL анализирует тексты настолько тщательно, что неверные толкования сводятся на нет. Иногда качество переведенных DeepL текстов практически достигает уровня переводчика-человека.

Основная проблема перевода с одного языка на другой заключается в том, что значение многих слов зависит от контекста. Два примера из английского языка: sanction может означать approve («одобрить») или penalize («оштрафовать»), а oversight — это существительное, происходящее от двух глаголов с противоположными значениями: oversee («следить») и overlook( «не заметить»). Соответственно, при переводе их на другие языки существует несколько вариантов. Например, sanction может быть переведено на немецкий как либо billigen, либо bestrafen, а oversight будет значить на русском или «контроль», или «недосмотр». Однако очень немногие компьютерные переводчики могут определить, какой из вариантов перевода будет верным.

Использование нейронных сетей

DeepL анализирует тексты с помощью нейронных сетей. Нейронные сети, иногда также немного помпезно называемые «искусственным интеллектом», решают задачи, опираясь на предопределенные шаблоны. Когда нейронная сеть обучается переводу, она сначала «загружается» верными существующими переводами. Она строит связи между ними до тех пор, пока на их основе не может определить, как должны переводиться новые тексты. Этот метод также называется «машинное обучение».

Обучение нейронной сети требует довольно больших ресурсов. Например, DeepL использует суперкомпьютер с производительностью 5.1 PetaFLOPS, что примерно соответствует производительности 5000 настольных компьютеров. «Головной мозг» DeepL расположен не в Германии, а в центре обработки данных в Кеблавике, Исландия. Там программе перевода легче сохранять «холодную голову»: низкая температура окружающей среды на этом острове Атлантического океана облегчает кондиционирование центра обработки данных.

Секретный рецепт качественного перевода

Инструменты онлайн-перевода от Google (Google Переводчик) и Microsoft (Bing Microsoft Translator) также используют нейронные сети. Однако их результаты далеки от качества немецкого новичка. Тексты, переведенные DeepL, иногда кажутся не просто работой, выполненной переводчиком-человеком, но даже и элегантной работой.

Как разработчикам из Кельна это удается? Компания молчит, лишь отмечая, что разработанное ей «новое расположение нейронов и их связей» лучше отражает естественный язык, чем предыдущие системы перевода.

В отличие от конкурентов, DeepL предлагает ограниченный набор языков. Система была запущена в 2017 году с семью языками: немецким, английским, французским, итальянским, голландским, польским и испанским. Португальский и русский были добавлены в декабре 2018 года, и разработчики говорят, что в стадии подготовки находятся японский и китайский язык. Для сравнения, Google в настоящее время предлагает 99 языков.

Как использовать DeepL

DeepL можно использовать бесплатно и без регистрации. Вы либо копируете текст для перевода в онлайн-форму, либо загружаете его как текстовый документ или презентацию. В форму можно вставить не более 5000 символов; размер загружаемых файлов не ограничен.

Большим преимуществом перевода через форму является то, что результат можно улучшить в интерактивном режиме. Если вы заметили «корявый» перевод, при нажатии на переведенный текст открывается всплывающее меню с альтернативными предложениями. Таким образом исправить перевод можно легко и быстро. DeepL исправляет не только отдельные слова: при необходимости программа предлагает совершенно новое предложение.

В DeepL также можно загрузить текстовые документы DOCX и презентации PPTX. В TextMaker нажмите Файл | Сохранить как и сохраните документ в формате «Microsoft Word 2007–2019 (*.docx)». В SoftMaker Presentations сохраните файл в формате «Документ PowerPoint 2007–2019 (*.pptx)». Затем с помощью мыши перетащите файл из проводника Windows в поле формы на сайте DeepL.

Учтите, что бесплатная версия возвращает документы только для чтения, из которых можно лишь скопировать текст без возможности его прямого редактирования. Кроме того, если вы загружаете файлы, исправить перевод в интерактивном режиме невозможно.

Немецкий конкурент Google, Microsoft и компании

Мы проверили семь инструментов онлайн-перевода — переводился один и тот же текст с английского языка, и DeepL намного превзошел всех своих конкурентов. Протестированы были следующие инструменты:

  • Babylon Next Generation (NG)
  • DeepL Translator
  • Google Переводчик
  • Bing Microsoft Translator
  • Promt Online Translator
  • Systran Text Translation
  • Бесплатный онлайновый переводчик ordLingo

Сравнение проводилось в один и тот же день в апреле 2019 года.

Некоторые результаты подтвердили распространенное мнение о компьютерных переводах: кто сможет понять, что означает «его прекрасная книга в нем позволяет ему самому себе»? Другие инструменты онлайн-перевода шокировали грубыми переводческими ошибками. Например, один из инструментов необъяснимым образом ошибочно принял «пунктуацию» за «пунктуальность». Некоторые сервисы оставляли непереведенными ключевые элементы текста — без каких-либо предупреждений или сообщений об ошибках.

Самые слабые результаты показали Babylon NG, Systran и WordLingo. Babylon обрабатывает только один единственный абзац, и в его переводах можно встретить сильно устаревший немецкий. Systran отметился грубейшими ошибками в нескольких переводах. WorldLingo оставил непереведенными несколько слов, а перевод состоял из очень длинных, трудных для понимания предложений. Promt сработал немного лучше, но его результат все же напоминал скорее бессвязный, чем внятный немецкий.

Bing Microsoft Translator показал неплохие результаты, но в целом сильно отстал от Google Переводчик. Подобно DeepL, при нажатии на предложение Google предлагает возможность выбрать альтернативный перевод. Однако Google Переводчик заменяет другим переводом все предложение полностью. В нашем тесте это привело к новым ошибкам.

DeepL победил всех конкурентов с большим отрывом и оказался готовым в том числе и к преднамеренным орфографическим ошибкам. После двух или трех щелчков по переводу результат выглядел так же, как если бы перевод выполнялся человеком. В случае англо-немецкого перевода DeepL стал также единственным инструментом, правильно расставляющим знаки препинания.

DeepL для профессиональных лингвистов

DeepL означает огромную экономию времени, особенно, когда речь идет о технических переводах. DeepL предлагает три ценовых категории платной подписки. Наиболее важным преимуществом, которое подписка предлагает профессиональным переводчикам, является защита данных.

При использовании бесплатной версии DeepL все загруженные тексты и их переводы сохраняются для обучения нейронной сети. Загрузки же подписчиков немедленно удаляются с серверов. Кроме того, версия Pro возвращает документы и презентации, не имеющие защиты от записи, а также принимает текстовые файлы (.txt). Тариф Starter включает в себя перевод пяти документов в месяц, Advanced — 20, и Ultimate — 100 документов в месяц.

Начиная с версии Advanced, DeepL также может быть интегрирован в профессиональные инструменты перевода (CAT, инструменты автоматизированного перевода), такие как SDL Trados Studio и memoQ. Разработчики программного обеспечения также могут интегрировать переводы DeepL в свои продукты, используя программный интерфейс DeepL. Оплата в этому случае рассчитывается на основе объема переводов.

Целесообразное использование DeepL

Для частных пользователей, которые переводят тексты от случая к случаю и не возражают против того, что их тексты будут храниться на серверах DeepL, бесплатная версия DeepL в настоящее время является наиболее привлекательным решением среди существующих на рынке. Конфиденциальные личные данные, такие как идентификационные номера, банковские реквизиты или данные авиарейсов, следует перед загрузкой удалять из текста, а затем снова добавлять вручную.

Если вам нужен перевод с языка или на язык, которые DeepL еще не поддерживает, единственными рекомендуемыми вариантами являются Google Translate и Bing Microsoft Translator. С одной стороны, их переводы могут быть очень неуклюжими, с другой — эти сервисы также могут переводить целые веб-страницы без необходимости копирования их в форму перевода. Когда вы отправляете письмо или сообщение, переведенное с использованием средств автоматического перевода, можно указать, что оно было переведено машиной и попросить учесть это.

Мы надеемся, что предложили вам полезный обзор текущего положения дел в области инструментов онлайн-перевода и ждем с нетерпением ваших отзывов. Вы уже используете какие-либо инструменты машинного перевода в повседневной жизни? Поделитесь с нами своим опытом в комментариях!


Комментарии

Ігор

12.06.2019 18:30

Протестирую на переписке с AliExpress

qqq

06.06.2019 05:09

Google Translate не хуже, но буду пользоваться.

Троглодит

03.06.2019 14:58

Чтобы оценить качество перевода, нужно хорошо знать оба языка. Но на всякий случай добавил страницу в избранное, буду пользоваться.

Добавить комментарий

Благодарим вас.

Продукт был добавлен в корзину.