Контролируемый язык в машинном переводе (Tkumjklnjrybdw x[dt f bgonuukb hyjyfk;y)
Эту статью предлагается удалить. |
Использование управляемого языка в машинном переводе создает ряд проблем.
В автоматизированном переводе первым шагом к пониманию контролируемого языка является знание того, что это такое, и различие между естественным языком и контролируемым языком.
Основная проблема машинного перевода - лингвистическая. Язык неоднозначен, и система пытается моделировать язык лексически и грамматически. Для решения этой проблемы существует множество альтернатив: например, может быть использован глоссарий, связанный с тематикой текста.
Контролируемый язык с десятью правилами
[править | править код]Каждый язык имеет свои грамматические правила. По этой причине в каждом языке правила для контролируемых языков различны. Не существует таких правил, которые давали бы подходящие для всех языков результаты. Однако существуют правила, которые снижают уровень двусмысленности в большинстве текстов на многих языках. Согласно статье Уве Мюгге "Контролируемый язык, оптимизированный для унификации перевода" (2002), следует применять следующие десять правил:[1]
1. Пишите предложения, которые короче 25 слов.
- Будьте кратки (используйте грамотно структурированные предложения)
- Избегайте двусмысленности и субординации
- Оцените информацию
2. Пишите предложения, которые выражают только одну идею.
- Простые предложения
- Старайтесь не использовать герундий, противопоставление и т. д.
3. Напишите одно и то же предложение, если хотите выразить одно и то же содержание.
- Не бойтесь повторять
- Избегайте синонимов
4. Пишите предложения, которые грамматически завершены.
- Предложения грамматически и орфографически правильные
- Не используйте многоточие
5. Пишите предложения, имеющие простую грамматическую структуру.
- Избегайте противопоставления, подчинения, относительных местоимений и т. д.
6. Пишите предложения в активной форме.
- Избегайте пассивного залога
7. Напишите предложения, которые повторяют существительное вместо местоимения.
- Избегайте местоимений like, their и т. д.
8. Напишите предложения, в которых артикли используются для идентификации существительных.
- Используйте то, это и т. д.
9. Пишите предложения, в которых используются слова из общего словаря.
- Не используйте технические термины
10. Пишите предложения, в которых используются только слова с правильным написанием.
- Избегайте ошибок
Преимущества использования контролируемого языка
[править | править код]Это позволяет создавать тексты, которые легче читать, понятнее и легче запоминать, а также с лучшим словарным запасом и стилем. Причины введения контролируемого языка включают в себя:
- Документы, которые более удобочитаемы и понятны, улучшают удобство использования продукта.
- Контролируемый язык гарантирует объективную и структурированную поддержку в типично субъективной и неструктурированной среде.
- Управляемые инструментами языковые среды позволяют автоматизировать многие задачи редактирования и обеспечивают объективные показатели качества процесса создания.
- Более строгий и контролируемый язык, более единообразный и стандартизированный результирующий исходный документ и более высокая частота совпадений в системе памяти переводов, а также стоимость перевода дешевле.
- Управляемый язык, предназначенный для машинного перевода, значительно улучшит качество генерируемых машиной предложений перевода, а также сократит время и затраты на редактирование человеческих переводчиков.
Контролируемый язык и перевод
[править | править код]Одной из самых больших проблем, стоящих перед организациями, которые хотят сократить затраты и время на перевод, является тот факт, что даже в средах, сочетающих системы управления контентом с технологией памяти переводов, процент непереведенных сегментов на новый документ остается довольно высоким. Хотя, безусловно, можно управлять контентом на уровне предложения/сегмента, в настоящее время лучшей практикой, по-видимому, является фрагментация на уровне темы. Это означает, что повторное использование происходит на довольно высоком уровне детализации.
Ссылки на литературу
[править | править код]- ↑ Uwe Muegge. Controlled Language Optimized for Uniform Translation (CLOUT) (англ.). — 2002. Архивировано 9 августа 2015 года.
Источники
[править | править код]- AMORES CARREDANO, Jose Javier. Automatic translation systems[on line]. Available in: http://quark.prbb.org/19/019046.htm [Date of view: 29 May 2011]
- AECMA: AECMA Simplified English: A Guide for the Preparation of Aircraft Maintenance Documentation in the International Aerospace Maintenance Language, Bruselas, 1995.
- Grimaila, A.; Chandioux, J.: "Made to measure solutions". In: John Newton, ed.: Computers in Translation: A Practical Appraisal, Londres, Routledge, 1992: 33-45.
- Hartley, A.F.; Paris, C.L.: «Multi-lingual document production: from support for translating to support for authoring», Machine Translation (Special Issue on new tools for human translators) 1997; 12 (12): 109-129.
- Ide, I; Véronis, J.: «Introduction to the Special Issue on Word Sense Disambiguation: The State of the Art», Computational Linguistics 1998; 24 (1): 1-40.
- Lehrberger, L.; Bourbeau, L.: Machine Translation: Linguistic Characteristics of machine translation Systems and General Methodology of Evaluation, Amsterdam/Filadelfia, John Benjamins, 1988.
Внешние ссылки
[править | править код]На эту статью не ссылаются другие статьи Википедии. |