СИСТЕМЫ МАШИННОГО ПЕРЕВОДА > Полезные советы
Тысяча полезных мелочей    

СИСТЕМЫ МАШИННОГО ПЕРЕВОДА

СИСТЕМЫ МАШИННОГО ПЕРЕВОДА

Карасев И.В. Артюшина Е.А. Статья в формате PDF 266 KB

Системы машинного перевода (МП) используются для обработки текста, при этом выделяют 2 типа систем: электронные словари и программы-переводчики.

Электронные словари оптимизируют процесс понимания иноязычных слов. Программы-переводчики производят более или менее адекватный перевод иностранных текстов, при этом необходимо участие человека в процессе перевода. По существу, системы МП выдают не перевод, а «подстрочник», который требует дальнейшей литературной обработки, достигающей для художественного текста 100 % всего объема, причем смысл порой полностью изменяется. Для технических текстов существует проблема неоднозначности слов для разных предметных областей.

Идея МП впервые пришла в голову еще в середине 19 века англичанину Чарльзу Бэббиджу, впервые разработавшему проект цифровой аналитической машины. В 1948 году было предложено правило разбиения слова на основу и окончание, которое продолжает активно использоваться современными системами МП.

В СССР работы, связанные с МП начались в 70-е годы под руководством проф. Белоногова.
В 1996 году первая российская система МП получила патент и была зарегистрирована под названием Retrans. В 1991 г. основана российская компания ПРОМТ, которая занимается исследованиями в области прикладной лингвистики, разработки технологий и систем МП для европейских языков.

Основная сложность систем МП состоит в том, что естественные языки плохо поддаются формализации. Сегодня существует 3 подхода к процессу МП: перевод, основанный на правилах; статистический перевод; подход Translation Memory.

Для перевода по правилам используется алгоритм, напоминающий процесс мышления человека, заключающийся в последовательности действий над входным предложением:

- морфологический анализ - поиск частей речи, определение входных словоформ (рода, числа, падежа, спряжения);

- поиск идиом, фразеологизмов для данной предметной области и исключение их из дальнейшего анализа;

- синтаксический анализ - разбор структуры, нахождение члeнов предложения - подлежащего, сказуемого, дополнения, обстоятельства. При этом общепризнанно, что системе МП легче переводить английский текст, так как в нем порядок слов в предложении жестко фиксируется. Русский язык поддерживает свободный порядок слов в предложении, что значительно усложняет процесс его формализации;

- лексический анализ - отделение однозначных входных слов (лексем) от многозначных (имеющих несколько переводных эквивалентов);

- грамматический анализ - доопределение грамматической информации с учетом данных выходного языка;

- синтез выходного предложения (перевода).

Статистический метод МП заключается в анализе колоссального массива параллельных текстов и выборе для перевода наиболее часто совпадающие варианты. Никаких грамматических правил в программу не заложено. На основе такой технологии построен сервис от компании Google - отдельные словосочетания при статистическом переводе получаются более точными и изящными, но грамматика хромает: иногда предложения настолько несогласованны, что невозможно понять их смысл.

Технология Translation Memory использует правила перевода и сравнивает входной документ с текстами из постоянно пополняющейся базы переводов. Находя совпадения, программа предлагает ранее одобренный вариант.

Признавая существующие недостатки производители систем МП подчеркивают, что их программы не ориентированы на создание художественного текста. И заменить человека они не смогут даже в долгосрочной перспективе - пока не будет создан полноценный искусственный интеллект. Но системы МП являются хорошим подспорьем для специалистов различных профилей, нуждающихся в оперативных переводах иноязычной информации.

Список литературы

  1. Соколова С.  Как переводит компьютер. - http://www.promt.ru/company. technology /articles/article_sokolova.php.
  2. Селегeй В. Электронные словари и компьютерная лексикография. - http://www.lingvoda.ru/transforum/articles/selegey_a1.asp.


ОЦЕНКА ДИНАМИКИ РАЗВИТИЯ КАЧЕСТВА ОБУЧЕНИЯ

ОЦЕНКА ДИНАМИКИ РАЗВИТИЯ КАЧЕСТВА ОБУЧЕНИЯ Статья в формате PDF 105 KB...

14 02 2026 12:50:46

ПАНКРЕАТИТ КАК ОСЛОЖНЕНИЕ ПАПИЛЛОТОМИЙ – ПРИЧИНЫ ВОЗНИКНОВЕНИЯ, МЕРЫ ПРОФИЛАКТИКИ

ПАНКРЕАТИТ КАК ОСЛОЖНЕНИЕ ПАПИЛЛОТОМИЙ – ПРИЧИНЫ ВОЗНИКНОВЕНИЯ, МЕРЫ ПРОФИЛАКТИКИ На материале 769 клинических наблюдений проведен анализ причин возникновения острого панкреатита после эндоскопической папиллотомии. Установлено, что основой их развития является прямое повреждение главного протока поджелудочной железы. Разработаны способы профилактики постманипуляционных панкреатитов. ...

13 02 2026 4:51:54

ВЛИЯНИЕ НОВОГО СУТОЧНОГО РИТМА НА СООТНОШЕНИЕ ОТДЕЛЬНЫХ СОСТАВНЫХ ЧАСТЕЙ ЯЙЦА ЯПОНСКИХ ПЕРЕПЕЛОК В НАЧАЛЕ ЯЙЦЕКЛАДКИ

ВЛИЯНИЕ НОВОГО СУТОЧНОГО РИТМА НА СООТНОШЕНИЕ ОТДЕЛЬНЫХ СОСТАВНЫХ ЧАСТЕЙ ЯЙЦА ЯПОНСКИХ ПЕРЕПЕЛОК В НАЧАЛЕ ЯЙЦЕКЛАДКИ В работе впервые приведены данные по соотношению отдельных составных частей яиц японских перепелок, выращенных в новых суточных ритмах. В начале яйцекладки средний масса желтка у опытных птиц больше на 1,0 %, масса белка у контрольных больше на 1,04 % от общего веса яйца. Масса скорлупы у обеих групп в начале яйцекладки одинакова .У опытных птиц между весом яйца и весовыми долями желтка и белка установлена прямая коррелятивная связь. Между массами яйца и желтка –слабая (r = +0,335), между массами яйца и белка – тесная(r = +0,999), между массами желтка и белка(r = +0,549) – средняя корреляция.). Отношение белка к желтку у контрольных яиц больше на 0,08 %. ...

05 02 2026 21:17:23

ПРОБЛЕМА ЗАМЕЩЕНИЕ ИМПОРТНЫХ ПОТОКОВ КАОЛИНА

ПРОБЛЕМА ЗАМЕЩЕНИЕ ИМПОРТНЫХ ПОТОКОВ КАОЛИНА Статья в формате PDF 121 KB...

04 02 2026 9:15:31

ДИРИЖЕРСКОЕ ИСКУССТВО С.А. КАЗАЧКОВА И КАЗАНСКАЯ ХОРОВАЯ ШКОЛА

ДИРИЖЕРСКОЕ ИСКУССТВО С.А. КАЗАЧКОВА И КАЗАНСКАЯ ХОРОВАЯ ШКОЛА В статье осмысливаются основные теоретические и эстетические аспекты дирижерской и педагогической деятельности С.А. Казачкова и последователей Казанской хоровой школы. Проведен анализ научных трудов С.А. Казачкова включающий осмысление сущности дирижерской профессии, выявление новых тенденций в творчестве, постижение природы дирижерского жеста. Показана сложность профессии дирижера, заключающейся в единении трех аспектов его деятельности: исполнительской, педагогической и управленческой, составляющей основу дирижерского искусства в культурном и эстетическом контексте. ...

30 01 2026 13:21:39

МАТЕМАТИЧЕСКОЕ МОДЕЛИРОВАНИЕ РЫБОЛОВНЫХ СИСТЕМ

МАТЕМАТИЧЕСКОЕ МОДЕЛИРОВАНИЕ РЫБОЛОВНЫХ СИСТЕМ Статья в формате PDF 106 KB...

27 01 2026 2:31:37

НАРКОМАНИЯ И ВИЧ-ИНФЕКЦИЯ

НАРКОМАНИЯ И ВИЧ-ИНФЕКЦИЯ Статья в формате PDF 264 KB...

21 01 2026 19:23:10

ИНТЕЛЛЕКТУАЛЬНЫЕ СИСТЕМЫ ПРИНЯТИЯ РЕШЕНИЙ

ИНТЕЛЛЕКТУАЛЬНЫЕ СИСТЕМЫ ПРИНЯТИЯ РЕШЕНИЙ Статья в формате PDF 95 KB...

19 01 2026 2:16:26

«ВЕЛИКАЯ ДЕПРЕССИЯ» – СОВРЕМЕННЫЙ ВЗГЛЯД

«ВЕЛИКАЯ ДЕПРЕССИЯ» – СОВРЕМЕННЫЙ ВЗГЛЯД Статья в формате PDF 268 KB...

18 01 2026 17:32:19

ПЛАЦЕНТАРНАЯ ЩЕЛОЧНАЯ ФОСФАТАЗА – МАРКЕР ЭМБРИОНАЛЬНЫХ И МАЛИГНИЗИРОВАННЫХ ТКАНЕЙ

ПЛАЦЕНТАРНАЯ ЩЕЛОЧНАЯ ФОСФАТАЗА – МАРКЕР ЭМБРИОНАЛЬНЫХ И МАЛИГНИЗИРОВАННЫХ ТКАНЕЙ Плацентарную щелочную фосфатазу (ПЩФ) относят к белкам, ассоциированным с беременностью и опухолевым ростом. ПЩФ образуется в плаценте и фетальных тканях, в крови беременных женщин выявляется с 10–14 недель в количестве от 1,0 до 40,0 Ед/л, сохраняясь в кровотоке после родов в течение 10–14 дней. ПЩФ является маркёром герминогенных опухолей, обнаруживается в биологических жидкостях, эпителиальных клетках, фибробластах стромы и эндотелии новообразующихся сосудов опухолевой ткани при paке лёгкого и других органов, что следует учитывать при назначении лечения. ...

09 01 2026 21:24:30

Еще:
Поддержать себя -1 :: Поддержать себя -2 :: Поддержать себя -3 :: Поддержать себя -4 :: Поддержать себя -5 :: Поддержать себя -6 :: Поддержать себя -7 :: Поддержать себя -8 :: Поддержать себя -9 :: Поддержать себя -10 :: Поддержать себя -11 :: Поддержать себя -12 :: Поддержать себя -13 :: Поддержать себя -14 :: Поддержать себя -15 :: Поддержать себя -16 :: Поддержать себя -17 :: Поддержать себя -18 :: Поддержать себя -19 :: Поддержать себя -20 :: Поддержать себя -21 :: Поддержать себя -22 :: Поддержать себя -23 :: Поддержать себя -24 :: Поддержать себя -25 :: Поддержать себя -26 :: Поддержать себя -27 :: Поддержать себя -28 :: Поддержать себя -29 :: Поддержать себя -30 :: Поддержать себя -31 :: Поддержать себя -32 :: Поддержать себя -33 :: Поддержать себя -34 :: Поддержать себя -35 :: Поддержать себя -36 :: Поддержать себя -37 :: Поддержать себя -38 ::