СИСТЕМЫ МАШИННОГО ПЕРЕВОДА
Системы машинного перевода (МП) используются для обработки текста, при этом выделяют 2 типа систем: электронные словари и программы-переводчики.
Электронные словари оптимизируют процесс понимания иноязычных слов. Программы-переводчики производят более или менее адекватный перевод иностранных текстов, при этом необходимо участие человека в процессе перевода. По существу, системы МП выдают не перевод, а «подстрочник», который требует дальнейшей литературной обработки, достигающей для художественного текста 100 % всего объема, причем смысл порой полностью изменяется. Для технических текстов существует проблема неоднозначности слов для разных предметных областей.
Идея МП впервые пришла в голову еще в середине 19 века англичанину Чарльзу Бэббиджу, впервые разработавшему проект цифровой аналитической машины. В 1948 году было предложено правило разбиения слова на основу и окончание, которое продолжает активно использоваться современными системами МП.
В СССР работы, связанные с МП начались в 70-е годы под руководством проф. Белоногова.
В 1996 году первая российская система МП получила патент и была зарегистрирована под названием Retrans. В 1991 г. основана российская компания ПРОМТ, которая занимается исследованиями в области прикладной лингвистики, разработки технологий и систем МП для европейских языков.
Основная сложность систем МП состоит в том, что естественные языки плохо поддаются формализации. Сегодня существует 3 подхода к процессу МП: перевод, основанный на правилах; статистический перевод; подход Translation Memory.
Для перевода по правилам используется алгоритм, напоминающий процесс мышления человека, заключающийся в последовательности действий над входным предложением:
- морфологический анализ - поиск частей речи, определение входных словоформ (рода, числа, падежа, спряжения);
- поиск идиом, фразеологизмов для данной предметной области и исключение их из дальнейшего анализа;
- синтаксический анализ - разбор структуры, нахождение члeнов предложения - подлежащего, сказуемого, дополнения, обстоятельства. При этом общепризнанно, что системе МП легче переводить английский текст, так как в нем порядок слов в предложении жестко фиксируется. Русский язык поддерживает свободный порядок слов в предложении, что значительно усложняет процесс его формализации;
- лексический анализ - отделение однозначных входных слов (лексем) от многозначных (имеющих несколько переводных эквивалентов);
- грамматический анализ - доопределение грамматической информации с учетом данных выходного языка;
- синтез выходного предложения (перевода).
Статистический метод МП заключается в анализе колоссального массива параллельных текстов и выборе для перевода наиболее часто совпадающие варианты. Никаких грамматических правил в программу не заложено. На основе такой технологии построен сервис от компании Google - отдельные словосочетания при статистическом переводе получаются более точными и изящными, но грамматика хромает: иногда предложения настолько несогласованны, что невозможно понять их смысл.
Технология Translation Memory использует правила перевода и сравнивает входной документ с текстами из постоянно пополняющейся базы переводов. Находя совпадения, программа предлагает ранее одобренный вариант.
Признавая существующие недостатки производители систем МП подчеркивают, что их программы не ориентированы на создание художественного текста. И заменить человека они не смогут даже в долгосрочной перспективе - пока не будет создан полноценный искусственный интеллект. Но системы МП являются хорошим подспорьем для специалистов различных профилей, нуждающихся в оперативных переводах иноязычной информации.
Список литературы
- Соколова С. Как переводит компьютер. - http://www.promt.ru/company. technology /articles/article_sokolova.php.
- Селегeй В. Электронные словари и компьютерная лексикография. - http://www.lingvoda.ru/transforum/articles/selegey_a1.asp.
Статья в формате PDF 260 KB...
25 04 2024 8:20:38
Статья в формате PDF 267 KB...
24 04 2024 0:33:40
Статья в формате PDF 157 KB...
23 04 2024 11:52:31
Статья в формате PDF 278 KB...
22 04 2024 2:49:37
Статья в формате PDF 104 KB...
21 04 2024 17:45:56
Статья в формате PDF 124 KB...
20 04 2024 14:16:52
Статья в формате PDF 121 KB...
19 04 2024 18:34:50
Статья в формате PDF 114 KB...
18 04 2024 19:12:33
Статья в формате PDF 154 KB...
17 04 2024 16:37:16
Статья в формате PDF 119 KB...
16 04 2024 13:10:50
Статья в формате PDF 116 KB...
15 04 2024 19:59:34
Статья в формате PDF 115 KB...
14 04 2024 20:43:26
Статья в формате PDF 103 KB...
13 04 2024 2:47:58
Статья в формате PDF 263 KB...
11 04 2024 22:12:52
Статья в формате PDF 115 KB...
10 04 2024 17:22:58
Статья в формате PDF 257 KB...
08 04 2024 9:44:26
Статья в формате PDF 251 KB...
07 04 2024 2:24:28
Статья в формате PDF 102 KB...
06 04 2024 23:52:45
Статья в формате PDF 101 KB...
05 04 2024 3:30:33
Статья в формате PDF 182 KB...
04 04 2024 5:33:35
Статья в формате PDF 157 KB...
03 04 2024 3:54:18
Статья в формате PDF 216 KB...
02 04 2024 21:27:41
Статья в формате PDF 276 KB...
01 04 2024 1:59:18
Статья в формате PDF 138 KB...
30 03 2024 1:49:43
Статья в формате PDF 116 KB...
28 03 2024 19:41:16
Статья в формате PDF 112 KB...
27 03 2024 14:34:59
Статья в формате PDF 106 KB...
26 03 2024 16:17:31
Инженерная рационализация лесопользования предполагает активное применение достижений древесиноведения. Фундаментальные достижения в этой области вполне могут быть применены в исследованиях свойств живой древесины растущих деревьев. Доказательство биотехнического принципа в данной статье выполнено на основе моделирования экспериментальных данных профессора Б.Н.Уголева по деформативности древесины при действии усилий поперек волокон. ...
25 03 2024 18:51:27
Статья в формате PDF 135 KB...
23 03 2024 6:22:11
Статья в формате PDF 114 KB...
22 03 2024 10:47:30
В последние годы для сжигания как традиционных топлив, так и биомасс различного происхождения широко применяются газификационные технологии. Газификация чаще всего производится в кипящем слое при недостатке окислителя. Конструкции установок по газификации различных топлив отличаются, но не принципиально. Также близкими оказываются и параметры генераторного газа. Необходимо развитие установок и технологий по совместной переработке различных топлив. ...
21 03 2024 22:27:39
20 03 2024 0:51:47
Статья в формате PDF 221 KB...
19 03 2024 20:25:34
Статья в формате PDF 103 KB...
18 03 2024 22:40:38
Статья в формате PDF 115 KB...
17 03 2024 15:28:11
Еще:
Поддержать себя -1 :: Поддержать себя -2 :: Поддержать себя -3 :: Поддержать себя -4 :: Поддержать себя -5 :: Поддержать себя -6 :: Поддержать себя -7 :: Поддержать себя -8 :: Поддержать себя -9 :: Поддержать себя -10 :: Поддержать себя -11 :: Поддержать себя -12 :: Поддержать себя -13 :: Поддержать себя -14 :: Поддержать себя -15 :: Поддержать себя -16 :: Поддержать себя -17 :: Поддержать себя -18 :: Поддержать себя -19 :: Поддержать себя -20 :: Поддержать себя -21 :: Поддержать себя -22 :: Поддержать себя -23 :: Поддержать себя -24 :: Поддержать себя -25 :: Поддержать себя -26 :: Поддержать себя -27 :: Поддержать себя -28 :: Поддержать себя -29 :: Поддержать себя -30 :: Поддержать себя -31 :: Поддержать себя -32 :: Поддержать себя -33 :: Поддержать себя -34 :: Поддержать себя -35 :: Поддержать себя -36 :: Поддержать себя -37 :: Поддержать себя -38 ::