СИСТЕМЫ МАШИННОГО ПЕРЕВОДА

Системы машинного перевода (МП) используются для обработки текста, при этом выделяют 2 типа систем: электронные словари и программы-переводчики.
Электронные словари оптимизируют процесс понимания иноязычных слов. Программы-переводчики производят более или менее адекватный перевод иностранных текстов, при этом необходимо участие человека в процессе перевода. По существу, системы МП выдают не перевод, а «подстрочник», который требует дальнейшей литературной обработки, достигающей для художественного текста 100 % всего объема, причем смысл порой полностью изменяется. Для технических текстов существует проблема неоднозначности слов для разных предметных областей.
Идея МП впервые пришла в голову еще в середине 19 века англичанину Чарльзу Бэббиджу, впервые разработавшему проект цифровой аналитической машины. В 1948 году было предложено правило разбиения слова на основу и окончание, которое продолжает активно использоваться современными системами МП.
В СССР работы, связанные с МП начались в 70-е годы под руководством проф. Белоногова.
В 1996 году первая российская система МП получила патент и была зарегистрирована под названием Retrans. В 1991 г. основана российская компания ПРОМТ, которая занимается исследованиями в области прикладной лингвистики, разработки технологий и систем МП для европейских языков.
Основная сложность систем МП состоит в том, что естественные языки плохо поддаются формализации. Сегодня существует 3 подхода к процессу МП: перевод, основанный на правилах; статистический перевод; подход Translation Memory.
Для перевода по правилам используется алгоритм, напоминающий процесс мышления человека, заключающийся в последовательности действий над входным предложением:
- морфологический анализ - поиск частей речи, определение входных словоформ (рода, числа, падежа, спряжения);
- поиск идиом, фразеологизмов для данной предметной области и исключение их из дальнейшего анализа;
- синтаксический анализ - разбор структуры, нахождение члeнов предложения - подлежащего, сказуемого, дополнения, обстоятельства. При этом общепризнанно, что системе МП легче переводить английский текст, так как в нем порядок слов в предложении жестко фиксируется. Русский язык поддерживает свободный порядок слов в предложении, что значительно усложняет процесс его формализации;
- лексический анализ - отделение однозначных входных слов (лексем) от многозначных (имеющих несколько переводных эквивалентов);
- грамматический анализ - доопределение грамматической информации с учетом данных выходного языка;
- синтез выходного предложения (перевода).
Статистический метод МП заключается в анализе колоссального массива параллельных текстов и выборе для перевода наиболее часто совпадающие варианты. Никаких грамматических правил в программу не заложено. На основе такой технологии построен сервис от компании Google - отдельные словосочетания при статистическом переводе получаются более точными и изящными, но грамматика хромает: иногда предложения настолько несогласованны, что невозможно понять их смысл.
Технология Translation Memory использует правила перевода и сравнивает входной документ с текстами из постоянно пополняющейся базы переводов. Находя совпадения, программа предлагает ранее одобренный вариант.
Признавая существующие недостатки производители систем МП подчеркивают, что их программы не ориентированы на создание художественного текста. И заменить человека они не смогут даже в долгосрочной перспективе - пока не будет создан полноценный искусственный интеллект. Но системы МП являются хорошим подспорьем для специалистов различных профилей, нуждающихся в оперативных переводах иноязычной информации.
Список литературы
- Соколова С. Как переводит компьютер. - http://www.promt.ru/company. technology /articles/article_sokolova.php.
- Селегeй В. Электронные словари и компьютерная лексикография. - http://www.lingvoda.ru/transforum/articles/selegey_a1.asp.
Статья в формате PDF
131 KB...
15 02 2026 14:31:10
На материале 769 клинических наблюдений проведен анализ причин возникновения острого панкреатита после эндоскопической папиллотомии. Установлено, что основой их развития является прямое повреждение главного протока поджелудочной железы. Разработаны способы профилактики постманипуляционных панкреатитов.
...
13 02 2026 4:51:54
12 02 2026 16:17:22
Статья в формате PDF
113 KB...
11 02 2026 0:34:32
Статья в формате PDF
137 KB...
10 02 2026 22:49:48
Статья в формате PDF
275 KB...
09 02 2026 17:24:30
Статья в формате PDF
273 KB...
08 02 2026 14:53:18
07 02 2026 22:30:34
Статья в формате PDF 315 KB...
06 02 2026 3:18:36
В работе впервые приведены данные по соотношению отдельных составных частей яиц японских перепелок, выращенных в новых суточных ритмах. В начале яйцекладки средний масса желтка у опытных птиц больше на 1,0 %, масса белка у контрольных больше на 1,04 % от общего веса яйца. Масса скорлупы у обеих групп в начале яйцекладки одинакова .У опытных птиц между весом яйца и весовыми долями желтка и белка установлена прямая коррелятивная связь. Между массами яйца и желтка –слабая (r = +0,335), между массами яйца и белка – тесная(r = +0,999), между массами желтка и белка(r = +0,549) – средняя корреляция.). Отношение белка к желтку у контрольных яиц больше на 0,08 %.
...
05 02 2026 21:17:23
Статья в формате PDF
104 KB...
03 02 2026 6:25:29
Статья в формате PDF
136 KB...
02 02 2026 10:15:34
Статья в формате PDF
116 KB...
01 02 2026 9:21:48
Статья в формате PDF
277 KB...
31 01 2026 2:41:30
В статье осмысливаются основные теоретические и эстетические аспекты дирижерской и педагогической деятельности С.А. Казачкова и последователей Казанской хоровой школы. Проведен анализ научных трудов С.А. Казачкова включающий осмысление сущности дирижерской профессии, выявление новых тенденций в творчестве, постижение природы дирижерского жеста. Показана сложность профессии дирижера, заключающейся в единении трех аспектов его деятельности: исполнительской, педагогической и управленческой, составляющей основу дирижерского искусства в культурном и эстетическом контексте.
...
30 01 2026 13:21:39
Статья в формате PDF
110 KB...
29 01 2026 18:10:24
Статья в формате PDF
114 KB...
28 01 2026 2:30:56
Статья в формате PDF
217 KB...
26 01 2026 11:34:15
Статья в формате PDF
157 KB...
25 01 2026 9:15:21
Статья в формате PDF
281 KB...
24 01 2026 9:47:15
Статья в формате PDF
126 KB...
23 01 2026 5:44:15
Статья в формате PDF
258 KB...
22 01 2026 11:43:21
Статья в формате PDF
240 KB...
20 01 2026 23:47:28
Статья в формате PDF
102 KB...
17 01 2026 12:51:37
Статья в формате PDF
129 KB...
16 01 2026 12:24:14
Статья в формате PDF
154 KB...
15 01 2026 13:38:24
Статья в формате PDF
688 KB...
14 01 2026 19:51:20
Статья в формате PDF
101 KB...
13 01 2026 17:18:42
Статья в формате PDF
127 KB...
12 01 2026 18:27:50
Статья в формате PDF
104 KB...
11 01 2026 13:11:23
Статья в формате PDF
124 KB...
10 01 2026 3:53:31
Плацентарную щелочную фосфатазу (ПЩФ) относят к белкам, ассоциированным с беременностью и опухолевым ростом. ПЩФ образуется в плаценте и фетальных тканях, в крови беременных женщин выявляется с 10–14 недель в количестве от 1,0 до 40,0 Ед/л, сохраняясь в кровотоке после родов в течение 10–14 дней.
ПЩФ является маркёром герминогенных опухолей, обнаруживается в биологических жидкостях, эпителиальных клетках, фибробластах стромы и эндотелии новообразующихся сосудов опухолевой ткани при paке лёгкого и других органов, что следует учитывать при назначении лечения.
...
09 01 2026 21:24:30
Статья в формате PDF
267 KB...
08 01 2026 4:11:40
Статья в формате PDF
104 KB...
07 01 2026 18:11:35
Еще:
Поддержать себя -1 :: Поддержать себя -2 :: Поддержать себя -3 :: Поддержать себя -4 :: Поддержать себя -5 :: Поддержать себя -6 :: Поддержать себя -7 :: Поддержать себя -8 :: Поддержать себя -9 :: Поддержать себя -10 :: Поддержать себя -11 :: Поддержать себя -12 :: Поддержать себя -13 :: Поддержать себя -14 :: Поддержать себя -15 :: Поддержать себя -16 :: Поддержать себя -17 :: Поддержать себя -18 :: Поддержать себя -19 :: Поддержать себя -20 :: Поддержать себя -21 :: Поддержать себя -22 :: Поддержать себя -23 :: Поддержать себя -24 :: Поддержать себя -25 :: Поддержать себя -26 :: Поддержать себя -27 :: Поддержать себя -28 :: Поддержать себя -29 :: Поддержать себя -30 :: Поддержать себя -31 :: Поддержать себя -32 :: Поддержать себя -33 :: Поддержать себя -34 :: Поддержать себя -35 :: Поддержать себя -36 :: Поддержать себя -37 :: Поддержать себя -38 ::