СИСТЕМЫ МАШИННОГО ПЕРЕВОДА > Полезные советы
Тысяча полезных мелочей    

СИСТЕМЫ МАШИННОГО ПЕРЕВОДА

СИСТЕМЫ МАШИННОГО ПЕРЕВОДА

Карасев И.В. Артюшина Е.А. Статья в формате PDF 266 KB

Системы машинного перевода (МП) используются для обработки текста, при этом выделяют 2 типа систем: электронные словари и программы-переводчики.

Электронные словари оптимизируют процесс понимания иноязычных слов. Программы-переводчики производят более или менее адекватный перевод иностранных текстов, при этом необходимо участие человека в процессе перевода. По существу, системы МП выдают не перевод, а «подстрочник», который требует дальнейшей литературной обработки, достигающей для художественного текста 100 % всего объема, причем смысл порой полностью изменяется. Для технических текстов существует проблема неоднозначности слов для разных предметных областей.

Идея МП впервые пришла в голову еще в середине 19 века англичанину Чарльзу Бэббиджу, впервые разработавшему проект цифровой аналитической машины. В 1948 году было предложено правило разбиения слова на основу и окончание, которое продолжает активно использоваться современными системами МП.

В СССР работы, связанные с МП начались в 70-е годы под руководством проф. Белоногова.
В 1996 году первая российская система МП получила патент и была зарегистрирована под названием Retrans. В 1991 г. основана российская компания ПРОМТ, которая занимается исследованиями в области прикладной лингвистики, разработки технологий и систем МП для европейских языков.

Основная сложность систем МП состоит в том, что естественные языки плохо поддаются формализации. Сегодня существует 3 подхода к процессу МП: перевод, основанный на правилах; статистический перевод; подход Translation Memory.

Для перевода по правилам используется алгоритм, напоминающий процесс мышления человека, заключающийся в последовательности действий над входным предложением:

- морфологический анализ - поиск частей речи, определение входных словоформ (рода, числа, падежа, спряжения);

- поиск идиом, фразеологизмов для данной предметной области и исключение их из дальнейшего анализа;

- синтаксический анализ - разбор структуры, нахождение члeнов предложения - подлежащего, сказуемого, дополнения, обстоятельства. При этом общепризнанно, что системе МП легче переводить английский текст, так как в нем порядок слов в предложении жестко фиксируется. Русский язык поддерживает свободный порядок слов в предложении, что значительно усложняет процесс его формализации;

- лексический анализ - отделение однозначных входных слов (лексем) от многозначных (имеющих несколько переводных эквивалентов);

- грамматический анализ - доопределение грамматической информации с учетом данных выходного языка;

- синтез выходного предложения (перевода).

Статистический метод МП заключается в анализе колоссального массива параллельных текстов и выборе для перевода наиболее часто совпадающие варианты. Никаких грамматических правил в программу не заложено. На основе такой технологии построен сервис от компании Google - отдельные словосочетания при статистическом переводе получаются более точными и изящными, но грамматика хромает: иногда предложения настолько несогласованны, что невозможно понять их смысл.

Технология Translation Memory использует правила перевода и сравнивает входной документ с текстами из постоянно пополняющейся базы переводов. Находя совпадения, программа предлагает ранее одобренный вариант.

Признавая существующие недостатки производители систем МП подчеркивают, что их программы не ориентированы на создание художественного текста. И заменить человека они не смогут даже в долгосрочной перспективе - пока не будет создан полноценный искусственный интеллект. Но системы МП являются хорошим подспорьем для специалистов различных профилей, нуждающихся в оперативных переводах иноязычной информации.

Список литературы

  1. Соколова С.  Как переводит компьютер. - http://www.promt.ru/company. technology /articles/article_sokolova.php.
  2. Селегeй В. Электронные словари и компьютерная лексикография. - http://www.lingvoda.ru/transforum/articles/selegey_a1.asp.


СТУПЕНЧАТЫЕ ПРЕДСТАВЛЕНИЯ НА ГРАФАХ

СТУПЕНЧАТЫЕ ПРЕДСТАВЛЕНИЯ НА ГРАФАХ Статья в формате PDF 127 KB...

10 06 2026 10:28:13

АСБЕСТОЗ НА АСБЕСТДОБЫВАЮЩИХ ПРЕДПРИЯТИЯХ

АСБЕСТОЗ НА АСБЕСТДОБЫВАЮЩИХ ПРЕДПРИЯТИЯХ Статья в формате PDF 144 KB...

07 06 2026 16:57:18

ТЕТРАДНЫЙ ЭФФЕКТ ФРАКЦИОНИРОВАНИЯ РЕДКОЗЕМЕЛЬНЫХ ЭЛЕМЕНТОВ И ЕГО ИСПОЛЬЗОВАНИЕ В РЕШЕНИИ ПРОБЛЕМ ПЕТРОЛОГИИ ГРАНИТОИДОВ

ТЕТРАДНЫЙ ЭФФЕКТ ФРАКЦИОНИРОВАНИЯ РЕДКОЗЕМЕЛЬНЫХ ЭЛЕМЕНТОВ И ЕГО ИСПОЛЬЗОВАНИЕ В РЕШЕНИИ ПРОБЛЕМ ПЕТРОЛОГИИ ГРАНИТОИДОВ Рассмотрены химические и термодинамические особенности возникновения тетрадного эффекта фpaкционирования редкоземельных элементов в высоко эволюционированных гранитоидах на многих примерах его проявления в отечественной и зарубежной пpaктики. Выявление тетрадного эффекта позволяет боле глубоко понять особенности петрологии развития магматических очагов многих интрузивных комплексов и потенциальные перспективы гранитоидов на редкометалльное и редкоземельное оруденение. Составлена математическая программа расчёта тетрадного эффекта фpaкционирования редкоземельных элементов, прилагаемая в электронном варианте к статье. ...

06 06 2026 16:37:24

ОБЗОР ПРОГРАММНЫХ ПРОЦЕССОРОВ ДЛЯ ПЛИС ФИРМЫ XILINX

ОБЗОР ПРОГРАММНЫХ ПРОЦЕССОРОВ ДЛЯ ПЛИС ФИРМЫ XILINX Статья в формате PDF 268 KB...

04 06 2026 2:43:24

КАЧЕСТВЕННЫЙ И КОЛИЧЕСТВЕННЫЙ СОСТАВ ИМПЛАНТАЦИОННЫХ КАЛЬЦИЙФОСФАТНЫХ МАТЕРИАЛОВ

КАЧЕСТВЕННЫЙ И КОЛИЧЕСТВЕННЫЙ СОСТАВ ИМПЛАНТАЦИОННЫХ КАЛЬЦИЙФОСФАТНЫХ МАТЕРИАЛОВ В лаборатории биохимии ФГУН «РНЦ «ВТО» им. акад. Г. А. Илизарова Росздрава» разработаны имплантационные материалы на основе кальцийфосфатных соединений, выделенных из костной ткани крупного рогатого скота. Технология получения материалов для имплантации включает в себя деминерализацию костной ткани с применением хлороводородной кислоты, осаждение из раствора кальцийфосфатных соединений, их очистку, высушивание и измельчение. Изучен качественный и количественный состав полученных материалов с применением сканирующей электронной микроскопии, инфpaкрасной спектроскопии и метода рентгеновского электронно-зондового микроанализа. Установлено, что материалы представляют собой порошкообразные смеси с включениями гранул диаметром от 100 до 2000 мкм. В состав материалов входят остеотропные элементы кальций, фосфор, магний, сера, которые однородно распределены в материале. ...

26 05 2026 13:26:54

ЭФФЕКТЫ ГЕПАТОПРОТЕКТОРА ПРИ ПОРАЖЕНИИ ПЕЧЕНИ У БОЛЬНЫХ ТУБЕРКУЛЕЗОМ ОРГАНОВ ДЫХАНИЯ

ЭФФЕКТЫ ГЕПАТОПРОТЕКТОРА ПРИ ПОРАЖЕНИИ ПЕЧЕНИ У БОЛЬНЫХ ТУБЕРКУЛЕЗОМ ОРГАНОВ ДЫХАНИЯ В статье представлена оценка гепатопротекторной активности сукцинатсодержащего раствора – ремаксола у больных туберкулезом органов дыхания на фоне проводимой специфической антибактериальной полихиотерапии. Эффективность терапии оценивалась по клиническим проявлениям лекарственной гепатотоксичности, активности цитолитических ферментов и маркеров синдрома холестаза с учетом типов адаптационных реакций. Показано позитивное влияние ремаксола на проявления лекарственной гепатотоксичности и адаптационные реакции организма, указывая на активное использование пластических субстратов, свидетельствуя об усилении репаративных процессов в гепатоцитах, способствуя восстановлению cтруктуры печеночной ткани и снижению патологических типов реактивности у больных с туберкулезом органов дыхания. ...

25 05 2026 1:48:58

МАТЕМАТИЧЕСКИЕ МОДЕЛИ В ЗДРАВООХРАНЕНИИ

МАТЕМАТИЧЕСКИЕ МОДЕЛИ В ЗДРАВООХРАНЕНИИ Статья в формате PDF 103 KB...

24 05 2026 12:15:56

Без уравнений нет математики

Без уравнений нет математики Статья в формате PDF 310 KB...

17 05 2026 8:18:11

БИОИНФОРМАЦИОННЫЕ ТЕХНОЛОГИИ В ОБРАЗОВАНИИ

БИОИНФОРМАЦИОННЫЕ ТЕХНОЛОГИИ В ОБРАЗОВАНИИ Статья в формате PDF 121 KB...

15 05 2026 11:53:29

КОНСЕРВАТИВНОЕ ЛЕЧЕНИЕ ТРАВМ СЕЛЕЗЕНКИ

КОНСЕРВАТИВНОЕ ЛЕЧЕНИЕ ТРАВМ СЕЛЕЗЕНКИ Представлены данные литературы, посвященные изучению консервативной тактике при травматических повреждениях селезенки. Показаны показания и противопоказания и необходимые условия для проведения консервативного лечения таких повреждений. ...

14 05 2026 5:37:13

Французская модель несостоятельности

Французская модель несостоятельности Статья в формате PDF 293 KB...

10 05 2026 14:35:19

Еще:
Поддержать себя -1 :: Поддержать себя -2 :: Поддержать себя -3 :: Поддержать себя -4 :: Поддержать себя -5 :: Поддержать себя -6 :: Поддержать себя -7 :: Поддержать себя -8 :: Поддержать себя -9 :: Поддержать себя -10 :: Поддержать себя -11 :: Поддержать себя -12 :: Поддержать себя -13 :: Поддержать себя -14 :: Поддержать себя -15 :: Поддержать себя -16 :: Поддержать себя -17 :: Поддержать себя -18 :: Поддержать себя -19 :: Поддержать себя -20 :: Поддержать себя -21 :: Поддержать себя -22 :: Поддержать себя -23 :: Поддержать себя -24 :: Поддержать себя -25 :: Поддержать себя -26 :: Поддержать себя -27 :: Поддержать себя -28 :: Поддержать себя -29 :: Поддержать себя -30 :: Поддержать себя -31 :: Поддержать себя -32 :: Поддержать себя -33 :: Поддержать себя -34 :: Поддержать себя -35 :: Поддержать себя -36 :: Поддержать себя -37 :: Поддержать себя -38 ::