СИСТЕМЫ МАШИННОГО ПЕРЕВОДА

Системы машинного перевода (МП) используются для обработки текста, при этом выделяют 2 типа систем: электронные словари и программы-переводчики.
Электронные словари оптимизируют процесс понимания иноязычных слов. Программы-переводчики производят более или менее адекватный перевод иностранных текстов, при этом необходимо участие человека в процессе перевода. По существу, системы МП выдают не перевод, а «подстрочник», который требует дальнейшей литературной обработки, достигающей для художественного текста 100 % всего объема, причем смысл порой полностью изменяется. Для технических текстов существует проблема неоднозначности слов для разных предметных областей.
Идея МП впервые пришла в голову еще в середине 19 века англичанину Чарльзу Бэббиджу, впервые разработавшему проект цифровой аналитической машины. В 1948 году было предложено правило разбиения слова на основу и окончание, которое продолжает активно использоваться современными системами МП.
В СССР работы, связанные с МП начались в 70-е годы под руководством проф. Белоногова.
В 1996 году первая российская система МП получила патент и была зарегистрирована под названием Retrans. В 1991 г. основана российская компания ПРОМТ, которая занимается исследованиями в области прикладной лингвистики, разработки технологий и систем МП для европейских языков.
Основная сложность систем МП состоит в том, что естественные языки плохо поддаются формализации. Сегодня существует 3 подхода к процессу МП: перевод, основанный на правилах; статистический перевод; подход Translation Memory.
Для перевода по правилам используется алгоритм, напоминающий процесс мышления человека, заключающийся в последовательности действий над входным предложением:
- морфологический анализ - поиск частей речи, определение входных словоформ (рода, числа, падежа, спряжения);
- поиск идиом, фразеологизмов для данной предметной области и исключение их из дальнейшего анализа;
- синтаксический анализ - разбор структуры, нахождение члeнов предложения - подлежащего, сказуемого, дополнения, обстоятельства. При этом общепризнанно, что системе МП легче переводить английский текст, так как в нем порядок слов в предложении жестко фиксируется. Русский язык поддерживает свободный порядок слов в предложении, что значительно усложняет процесс его формализации;
- лексический анализ - отделение однозначных входных слов (лексем) от многозначных (имеющих несколько переводных эквивалентов);
- грамматический анализ - доопределение грамматической информации с учетом данных выходного языка;
- синтез выходного предложения (перевода).
Статистический метод МП заключается в анализе колоссального массива параллельных текстов и выборе для перевода наиболее часто совпадающие варианты. Никаких грамматических правил в программу не заложено. На основе такой технологии построен сервис от компании Google - отдельные словосочетания при статистическом переводе получаются более точными и изящными, но грамматика хромает: иногда предложения настолько несогласованны, что невозможно понять их смысл.
Технология Translation Memory использует правила перевода и сравнивает входной документ с текстами из постоянно пополняющейся базы переводов. Находя совпадения, программа предлагает ранее одобренный вариант.
Признавая существующие недостатки производители систем МП подчеркивают, что их программы не ориентированы на создание художественного текста. И заменить человека они не смогут даже в долгосрочной перспективе - пока не будет создан полноценный искусственный интеллект. Но системы МП являются хорошим подспорьем для специалистов различных профилей, нуждающихся в оперативных переводах иноязычной информации.
Список литературы
- Соколова С. Как переводит компьютер. - http://www.promt.ru/company. technology /articles/article_sokolova.php.
- Селегeй В. Электронные словари и компьютерная лексикография. - http://www.lingvoda.ru/transforum/articles/selegey_a1.asp.
Статья в формате PDF
102 KB...
28 05 2026 1:46:42
Статья в формате PDF
242 KB...
27 05 2026 4:49:15
Статья в формате PDF
121 KB...
26 05 2026 9:12:55
Статья в формате PDF
256 KB...
25 05 2026 17:24:45
Статья в формате PDF 281 KB...
24 05 2026 7:56:40
Статья в формате PDF
130 KB...
23 05 2026 21:13:28
22 05 2026 22:53:29
Статья в формате PDF
246 KB...
21 05 2026 12:51:51
Статья в формате PDF
130 KB...
20 05 2026 18:12:32
19 05 2026 0:31:33
Статья в формате PDF
131 KB...
17 05 2026 6:22:10
Статья в формате PDF
470 KB...
15 05 2026 2:50:38
В результате патогенетического обоснования компьютерной дермографии (КД) изучены возможности использования этого метода при бронхиальной астме (БА) у 176 пациентов в возрасте от 3 до 15 лет. Показаны возможности использования КД для диагностики периода БА, форм тяжести и тяжести приступа заболевания, дифференциальной диагностики интермиттирующей и персистирующей БА, контроля течения и оценки эффективности терапии у детей и подростков.
...
14 05 2026 18:37:54
Статья в формате PDF
111 KB...
13 05 2026 2:23:38
В статье авторами рассмотрены региональные особенности социальной защиты ветеранов, инвалидов и пожилых граждан, в частности, меры социальной поддержки и социальное обслуживание.
...
12 05 2026 4:46:35
С помощью элементарных методов комбинаторной математики и единственности решений систем линейных алгебраических уравнений для невырожденных случаев доказана теорема о количестве и структуре особых точек n–мерной динамической системы популяционной динамики Лотки-Вольтерра. Показано, что количество особых точек для этой системы равняется 2n, а их структура в отношении сочетания нулевых и ненулевых координат совпадает с биноминальными коэффициентами. Сделано предположение, что с помощью этой динамической системы можно моделировать конкурентные взаимодействия среди n научных фронтов в рамках широкой области научных исследований.
...
11 05 2026 21:45:31
Статья в формате PDF
109 KB...
10 05 2026 18:30:58
Статья в формате PDF
262 KB...
09 05 2026 10:53:56
Статья в формате PDF
151 KB...
08 05 2026 14:11:50
Статья в формате PDF
146 KB...
07 05 2026 0:10:32
Статья в формате PDF
120 KB...
06 05 2026 10:19:24
Статья в формате PDF
133 KB...
05 05 2026 21:59:38
Статья в формате PDF
103 KB...
04 05 2026 23:41:51
Статья в формате PDF
110 KB...
03 05 2026 23:53:42
Статья в формате PDF
313 KB...
02 05 2026 19:45:11
Статья в формате PDF
373 KB...
01 05 2026 7:17:20
Статья в формате PDF
245 KB...
30 04 2026 1:35:53
Статья в формате PDF
217 KB...
28 04 2026 12:35:17
Статья в формате PDF
115 KB...
27 04 2026 8:32:56
Статья в формате PDF
156 KB...
26 04 2026 5:48:41
Статья в формате PDF
141 KB...
25 04 2026 23:20:22
Статья в формате PDF
106 KB...
24 04 2026 10:16:38
Статья в формате PDF
255 KB...
22 04 2026 23:20:40
Выбрать оптимальный метод введения больных в период реабилитации после черепно-мозговой травмы. Материалы и методы: За 2011 год в Новокуйбышевской центральной городской больницы пролечено 960 пострадавших с черепно-мозговой травмой, из них 780 пострадавших с сотрясением головного мозга. Все пациенты с сотрясением головного мозга, первых семь дней находились на стационарном лечении в условиях травматологического отделения. Под наблюдением врачей нейрохирурга, травматолога, невролога и окулиста, проводилась дегидратационная и симптоматическая терапия. После первой недели стационарного лечения данных пациентов разделили на три равных группы по 260 человек и в дальнейшем их вели по- разному. Результаты: Удовлетворительные результаты лечения получены в первой группе у 252 пациентов (97%), у второй группы 243 пациентов(93%), а в третьей 156 пациентов (60%). Один день дневного стационара в травматологическом отделение в Новокуйбышевской центральной городской больницы НЦГБ стоит 360 рублей, а один день дневного стационара, стоит 190 рублей. Таким образом стоимость лечения пациентов первой группы = (7 + 7)·360 = 5040 рублей, стоимость лечения пациентов второй группы = 7·360 + 7·190 = 2520 + 1330 = 3850 рублей, стоимость лечения пациентов третьей группы = 7·360 = 2520 рублей. Из данных расчетов видно, что пациенты третьей группы, требует меньше расходов, но к сожалению, у них намного хуже результаты лечения. Результаты лечения пациентов первой и второй группы пpaктически одинаковы, а стоимость пациентов второй группы намного меньше.
...
21 04 2026 3:14:16
Статья в формате PDF
157 KB...
19 04 2026 1:53:11
Еще:
Поддержать себя -1 :: Поддержать себя -2 :: Поддержать себя -3 :: Поддержать себя -4 :: Поддержать себя -5 :: Поддержать себя -6 :: Поддержать себя -7 :: Поддержать себя -8 :: Поддержать себя -9 :: Поддержать себя -10 :: Поддержать себя -11 :: Поддержать себя -12 :: Поддержать себя -13 :: Поддержать себя -14 :: Поддержать себя -15 :: Поддержать себя -16 :: Поддержать себя -17 :: Поддержать себя -18 :: Поддержать себя -19 :: Поддержать себя -20 :: Поддержать себя -21 :: Поддержать себя -22 :: Поддержать себя -23 :: Поддержать себя -24 :: Поддержать себя -25 :: Поддержать себя -26 :: Поддержать себя -27 :: Поддержать себя -28 :: Поддержать себя -29 :: Поддержать себя -30 :: Поддержать себя -31 :: Поддержать себя -32 :: Поддержать себя -33 :: Поддержать себя -34 :: Поддержать себя -35 :: Поддержать себя -36 :: Поддержать себя -37 :: Поддержать себя -38 ::