СИСТЕМЫ МАШИННОГО ПЕРЕВОДА

Системы машинного перевода (МП) используются для обработки текста, при этом выделяют 2 типа систем: электронные словари и программы-переводчики.
Электронные словари оптимизируют процесс понимания иноязычных слов. Программы-переводчики производят более или менее адекватный перевод иностранных текстов, при этом необходимо участие человека в процессе перевода. По существу, системы МП выдают не перевод, а «подстрочник», который требует дальнейшей литературной обработки, достигающей для художественного текста 100 % всего объема, причем смысл порой полностью изменяется. Для технических текстов существует проблема неоднозначности слов для разных предметных областей.
Идея МП впервые пришла в голову еще в середине 19 века англичанину Чарльзу Бэббиджу, впервые разработавшему проект цифровой аналитической машины. В 1948 году было предложено правило разбиения слова на основу и окончание, которое продолжает активно использоваться современными системами МП.
В СССР работы, связанные с МП начались в 70-е годы под руководством проф. Белоногова.
В 1996 году первая российская система МП получила патент и была зарегистрирована под названием Retrans. В 1991 г. основана российская компания ПРОМТ, которая занимается исследованиями в области прикладной лингвистики, разработки технологий и систем МП для европейских языков.
Основная сложность систем МП состоит в том, что естественные языки плохо поддаются формализации. Сегодня существует 3 подхода к процессу МП: перевод, основанный на правилах; статистический перевод; подход Translation Memory.
Для перевода по правилам используется алгоритм, напоминающий процесс мышления человека, заключающийся в последовательности действий над входным предложением:
- морфологический анализ - поиск частей речи, определение входных словоформ (рода, числа, падежа, спряжения);
- поиск идиом, фразеологизмов для данной предметной области и исключение их из дальнейшего анализа;
- синтаксический анализ - разбор структуры, нахождение члeнов предложения - подлежащего, сказуемого, дополнения, обстоятельства. При этом общепризнанно, что системе МП легче переводить английский текст, так как в нем порядок слов в предложении жестко фиксируется. Русский язык поддерживает свободный порядок слов в предложении, что значительно усложняет процесс его формализации;
- лексический анализ - отделение однозначных входных слов (лексем) от многозначных (имеющих несколько переводных эквивалентов);
- грамматический анализ - доопределение грамматической информации с учетом данных выходного языка;
- синтез выходного предложения (перевода).
Статистический метод МП заключается в анализе колоссального массива параллельных текстов и выборе для перевода наиболее часто совпадающие варианты. Никаких грамматических правил в программу не заложено. На основе такой технологии построен сервис от компании Google - отдельные словосочетания при статистическом переводе получаются более точными и изящными, но грамматика хромает: иногда предложения настолько несогласованны, что невозможно понять их смысл.
Технология Translation Memory использует правила перевода и сравнивает входной документ с текстами из постоянно пополняющейся базы переводов. Находя совпадения, программа предлагает ранее одобренный вариант.
Признавая существующие недостатки производители систем МП подчеркивают, что их программы не ориентированы на создание художественного текста. И заменить человека они не смогут даже в долгосрочной перспективе - пока не будет создан полноценный искусственный интеллект. Но системы МП являются хорошим подспорьем для специалистов различных профилей, нуждающихся в оперативных переводах иноязычной информации.
Список литературы
- Соколова С. Как переводит компьютер. - http://www.promt.ru/company. technology /articles/article_sokolova.php.
- Селегeй В. Электронные словари и компьютерная лексикография. - http://www.lingvoda.ru/transforum/articles/selegey_a1.asp.
Статья в формате PDF
121 KB...
29 03 2026 4:38:38
Статья в формате PDF
109 KB...
28 03 2026 8:33:44
Статья в формате PDF
148 KB...
27 03 2026 6:17:45
Статья в формате PDF
103 KB...
26 03 2026 3:42:56
Статья в формате PDF
120 KB...
25 03 2026 1:43:18
Статья в формате PDF
264 KB...
24 03 2026 19:24:25
Статья в формате PDF
249 KB...
23 03 2026 4:54:32
Статья в формате PDF
262 KB...
22 03 2026 2:12:49
Статья в формате PDF
137 KB...
21 03 2026 23:45:16
Статья в формате PDF
202 KB...
20 03 2026 20:27:55
19 03 2026 13:36:46
18 03 2026 22:13:24
Статья в формате PDF
122 KB...
16 03 2026 18:22:21
Приведены геологические, геохимические и петрологические данные по щелочным гранитоидам майорского комплекса среднего девона. В его составе описаны 4 фазы внедрения: 1) роговообманковые габбро, габбро-нориты и габбро-диориты; 2) кварцевые диориты, гранодиориты амфибол-биотитовые; 3) биотит-амфиболовые граниты, субщелочные и рибекитовые граниты; 4) субщелочные лейкограниты, лейкограниты. Петрогеохимическими особенностями гранитоидов майорского типа являются повышенная щёлочность и наличие щелочного амфибола – рибекита. Прострaнcтвенно и парагенетически с майорскими гранитами, относящимися к анорогенной геодинамической обстановке формирования, ассоциирует железорудное и редкоземельное оруденение и щелочные метасоматиты. В экзоконтакте с Майорским массивом сформировались везувиан-гранат-пироксеновые скарны.
...
15 03 2026 23:18:55
Статья в формате PDF
101 KB...
14 03 2026 13:34:11
Статья в формате PDF
487 KB...
13 03 2026 13:21:19
Статья в формате PDF
107 KB...
12 03 2026 4:34:34
Рассмотрена концепция зависимости лесов как ядра биосферы Земли от активности Солнца по числу Вольфа. Принята точка на Земле в виде участка лесистой территории национального парка по лесным пожарам за 2002 год. По датам каждого лесного пожара были учтены: время от зимнего солнцестояния с 21 марта, склонение оси Земли к Солнцу, число Вольфа активности Солнца на день возникновения лесного пожара. Среди влияющих факторов первое место заняло время от зимнего солнцестояния. Второе место – склонение Солнца, а на третье – число Вольфа. Среди зависимых факторов первым стало склонение Солнца, вторым – время от 21.03, а третьим активность Солнца. В итоге параметры Земли первичны. Наиболее опасен интервал числа Вольфа 90 ≤ V ≤ 180 и сильный размах колебания во многом зависит от поведения людей.
...
11 03 2026 13:27:22
Статья в формате PDF
103 KB...
09 03 2026 19:12:45
Статья в формате PDF
355 KB...
08 03 2026 0:41:38
Статья в формате PDF
112 KB...
07 03 2026 7:41:59
Статья в формате PDF
113 KB...
05 03 2026 4:26:42
04 03 2026 3:47:44
Статья в формате PDF
250 KB...
02 03 2026 11:56:45
Статья в формате PDF
117 KB...
01 03 2026 2:57:42
Статья в формате PDF
121 KB...
28 02 2026 3:47:33
Статья в формате PDF
240 KB...
27 02 2026 17:35:24
Статья в формате PDF
136 KB...
26 02 2026 13:56:20
Представленная статья посвящена исследованию понятия честь в качестве фундаментальной категории права. В работе отмечено, что основой для соблюдения права, уважения к закону является честь. Данное понятие включает в себя такие качества, как целомудрие и благородство. Основным же назначением государства является защита чести своих граждан. Эта высокая миссия тесно связана с единственной целью государственности как формы человеческого бытия – с содействием духовному возрастанию человека.
...
25 02 2026 3:20:35
Статья в формате PDF
466 KB...
24 02 2026 17:39:16
Статья в формате PDF
121 KB...
23 02 2026 16:42:11
Статья в формате PDF
109 KB...
22 02 2026 6:33:11
Статья в формате PDF
269 KB...
21 02 2026 16:15:37
20 02 2026 10:35:58
Статья в формате PDF
263 KB...
19 02 2026 3:12:37
Статья в формате PDF
122 KB...
18 02 2026 8:42:26
Еще:
Поддержать себя -1 :: Поддержать себя -2 :: Поддержать себя -3 :: Поддержать себя -4 :: Поддержать себя -5 :: Поддержать себя -6 :: Поддержать себя -7 :: Поддержать себя -8 :: Поддержать себя -9 :: Поддержать себя -10 :: Поддержать себя -11 :: Поддержать себя -12 :: Поддержать себя -13 :: Поддержать себя -14 :: Поддержать себя -15 :: Поддержать себя -16 :: Поддержать себя -17 :: Поддержать себя -18 :: Поддержать себя -19 :: Поддержать себя -20 :: Поддержать себя -21 :: Поддержать себя -22 :: Поддержать себя -23 :: Поддержать себя -24 :: Поддержать себя -25 :: Поддержать себя -26 :: Поддержать себя -27 :: Поддержать себя -28 :: Поддержать себя -29 :: Поддержать себя -30 :: Поддержать себя -31 :: Поддержать себя -32 :: Поддержать себя -33 :: Поддержать себя -34 :: Поддержать себя -35 :: Поддержать себя -36 :: Поддержать себя -37 :: Поддержать себя -38 ::