Контролируемый язык в машинном переводе (Tkumjklnjrybdw x[dt f bgonuukb hyjyfk;y)

Перейти к навигации Перейти к поиску

Использование управляемого языка в машинном переводе создает ряд проблем.

В автоматизированном переводе первым шагом к пониманию контролируемого языка является знание того, что это такое, и различие между естественным языком и контролируемым языком.

Основная проблема машинного перевода - лингвистическая. Язык неоднозначен, и система пытается моделировать язык лексически и грамматически. Для решения этой проблемы существует множество альтернатив: например, может быть использован глоссарий, связанный с тематикой текста.

Контролируемый язык с десятью правилами[править | править код]

Каждый язык имеет свои грамматические правила. По этой причине в каждом языке правила для контролируемых языков различны. Не существует таких правил, которые давали бы подходящие для всех языков результаты. Однако существуют правила, которые снижают уровень двусмысленности в большинстве текстов на многих языках. Согласно статье Уве Мюгге "Контролируемый язык, оптимизированный для унификации перевода" (2002), следует применять следующие десять правил:[1]

1. Пишите предложения, которые короче 25 слов.

  • Будьте кратки (используйте грамотно структурированные предложения)
  • Избегайте двусмысленности и субординации
  • Оцените информацию

2. Пишите предложения, которые выражают только одну идею.

  • Простые предложения
  • Старайтесь не использовать герундий, противопоставление и т. д.

3. Напишите одно и то же предложение, если хотите выразить одно и то же содержание.

  • Не бойтесь повторять
  • Избегайте синонимов

4. Пишите предложения, которые грамматически завершены.

  • Предложения грамматически и орфографически правильные
  • Не используйте многоточие

5. Пишите предложения, имеющие простую грамматическую структуру.

  • Избегайте противопоставления, подчинения, относительных местоимений и т. д.

6. Пишите предложения в активной форме.

  • Избегайте пассивного залога

7. Напишите предложения, которые повторяют существительное вместо местоимения.

  • Избегайте местоимений like, their и т. д.

8. Напишите предложения, в которых артикли используются для идентификации существительных.

  • Используйте то, это и т. д.

9. Пишите предложения, в которых используются слова из общего словаря.

  • Не используйте технические термины

10. Пишите предложения, в которых используются только слова с правильным написанием.

  • Избегайте ошибок

Преимущества использования контролируемого языка[править | править код]

Это позволяет создавать тексты, которые легче читать, понятнее и легче запоминать, а также с лучшим словарным запасом и стилем. Причины введения контролируемого языка включают в себя:

  • Документы, которые более удобочитаемы и понятны, улучшают удобство использования продукта.
  • Контролируемый язык гарантирует объективную и структурированную поддержку в типично субъективной и неструктурированной среде.
  • Управляемые инструментами языковые среды позволяют автоматизировать многие задачи редактирования и обеспечивают объективные показатели качества процесса создания.
  • Более строгий и контролируемый язык, более единообразный и стандартизированный результирующий исходный документ и более высокая частота совпадений в системе памяти переводов, а также стоимость перевода дешевле.
  • Управляемый язык, предназначенный для машинного перевода, значительно улучшит качество генерируемых машиной предложений перевода, а также сократит время и затраты на редактирование человеческих переводчиков.

Контролируемый язык и перевод[править | править код]

Одной из самых больших проблем, стоящих перед организациями, которые хотят сократить затраты и время на перевод, является тот факт, что даже в средах, сочетающих системы управления контентом с технологией памяти переводов, процент непереведенных сегментов на новый документ остается довольно высоким. Хотя, безусловно, можно управлять контентом на уровне предложения/сегмента, в настоящее время лучшей практикой, по-видимому, является фрагментация на уровне темы. Это означает, что повторное использование происходит на довольно высоком уровне детализации.

Ссылки на литературу[править | править код]

  1. Uwe Muegge. Controlled Language Optimized for Uniform Translation (CLOUT) (англ.). — 2002. Архивировано 9 августа 2015 года.

Источники[править | править код]

  • AMORES CARREDANO, Jose Javier. Automatic translation systems[on line]. Available in: http://quark.prbb.org/19/019046.htm [Date of view: 29 May 2011]
  • AECMA: AECMA Simplified English: A Guide for the Preparation of Aircraft Maintenance Documentation in the International Aerospace Maintenance Language, Bruselas, 1995.
  • Grimaila, A.; Chandioux, J.: "Made to measure solutions". In: John Newton, ed.: Computers in Translation: A Practical Appraisal, Londres, Routledge, 1992: 33-45.
  • Hartley, A.F.; Paris, C.L.: «Multi-lingual document production: from support for translating to support for authoring», Machine Translation (Special Issue on new tools for human translators) 1997; 12 (12): 109-129.
  • Ide, I; Véronis, J.: «Introduction to the Special Issue on Word Sense Disambiguation: The State of the Art», Computational Linguistics 1998; 24 (1): 1-40.
  • Lehrberger, L.; Bourbeau, L.: Machine Translation: Linguistic Characteristics of machine translation Systems and General Methodology of Evaluation, Amsterdam/Filadelfia, John Benjamins, 1988.

Внешние ссылки[править | править код]