СИСТЕМЫ МАШИННОГО ПЕРЕВОДА

Системы машинного перевода (МП) используются для обработки текста, при этом выделяют 2 типа систем: электронные словари и программы-переводчики.
Электронные словари оптимизируют процесс понимания иноязычных слов. Программы-переводчики производят более или менее адекватный перевод иностранных текстов, при этом необходимо участие человека в процессе перевода. По существу, системы МП выдают не перевод, а «подстрочник», который требует дальнейшей литературной обработки, достигающей для художественного текста 100 % всего объема, причем смысл порой полностью изменяется. Для технических текстов существует проблема неоднозначности слов для разных предметных областей.
Идея МП впервые пришла в голову еще в середине 19 века англичанину Чарльзу Бэббиджу, впервые разработавшему проект цифровой аналитической машины. В 1948 году было предложено правило разбиения слова на основу и окончание, которое продолжает активно использоваться современными системами МП.
В СССР работы, связанные с МП начались в 70-е годы под руководством проф. Белоногова.
В 1996 году первая российская система МП получила патент и была зарегистрирована под названием Retrans. В 1991 г. основана российская компания ПРОМТ, которая занимается исследованиями в области прикладной лингвистики, разработки технологий и систем МП для европейских языков.
Основная сложность систем МП состоит в том, что естественные языки плохо поддаются формализации. Сегодня существует 3 подхода к процессу МП: перевод, основанный на правилах; статистический перевод; подход Translation Memory.
Для перевода по правилам используется алгоритм, напоминающий процесс мышления человека, заключающийся в последовательности действий над входным предложением:
- морфологический анализ - поиск частей речи, определение входных словоформ (рода, числа, падежа, спряжения);
- поиск идиом, фразеологизмов для данной предметной области и исключение их из дальнейшего анализа;
- синтаксический анализ - разбор структуры, нахождение члeнов предложения - подлежащего, сказуемого, дополнения, обстоятельства. При этом общепризнанно, что системе МП легче переводить английский текст, так как в нем порядок слов в предложении жестко фиксируется. Русский язык поддерживает свободный порядок слов в предложении, что значительно усложняет процесс его формализации;
- лексический анализ - отделение однозначных входных слов (лексем) от многозначных (имеющих несколько переводных эквивалентов);
- грамматический анализ - доопределение грамматической информации с учетом данных выходного языка;
- синтез выходного предложения (перевода).
Статистический метод МП заключается в анализе колоссального массива параллельных текстов и выборе для перевода наиболее часто совпадающие варианты. Никаких грамматических правил в программу не заложено. На основе такой технологии построен сервис от компании Google - отдельные словосочетания при статистическом переводе получаются более точными и изящными, но грамматика хромает: иногда предложения настолько несогласованны, что невозможно понять их смысл.
Технология Translation Memory использует правила перевода и сравнивает входной документ с текстами из постоянно пополняющейся базы переводов. Находя совпадения, программа предлагает ранее одобренный вариант.
Признавая существующие недостатки производители систем МП подчеркивают, что их программы не ориентированы на создание художественного текста. И заменить человека они не смогут даже в долгосрочной перспективе - пока не будет создан полноценный искусственный интеллект. Но системы МП являются хорошим подспорьем для специалистов различных профилей, нуждающихся в оперативных переводах иноязычной информации.
Список литературы
- Соколова С. Как переводит компьютер. - http://www.promt.ru/company. technology /articles/article_sokolova.php.
- Селегeй В. Электронные словари и компьютерная лексикография. - http://www.lingvoda.ru/transforum/articles/selegey_a1.asp.
Статья в формате PDF
131 KB...
08 06 2026 18:27:48
Статья в формате PDF
420 KB...
07 06 2026 17:37:38
Статья в формате PDF
139 KB...
06 06 2026 21:30:29
Статья в формате PDF
125 KB...
05 06 2026 11:19:49
В статье освещаются морфофункциональные особенности структуры стенки тонкой кишки в зависимости от хаpaктера вскармливания в экспериментальных условиях. Представлены собственные результаты исследования по вопросу о электронно-микроскопическом строении слоев стенки тонкой кишки при смешанном и искусственном вскармливании в эксперименте.
...
04 06 2026 12:33:48
Статья в формате PDF
111 KB...
03 06 2026 1:19:13
Статья в формате PDF
125 KB...
02 06 2026 19:51:25
Статья в формате PDF
253 KB...
31 05 2026 1:11:46
Статья в формате PDF
291 KB...
30 05 2026 16:43:14
Статья в формате PDF
132 KB...
29 05 2026 15:55:41
Статья в формате PDF
124 KB...
28 05 2026 11:38:41
Статья в формате PDF
111 KB...
27 05 2026 19:28:53
24 05 2026 19:30:58
Статья в формате PDF
175 KB...
23 05 2026 10:41:26
21 05 2026 6:18:48
Статья в формате PDF
104 KB...
19 05 2026 15:38:29
Целиакия – энтеропатия, обусловленная развитием неадекватной иммунной реакции в ответ на поступление глютена – белка, содержащегося в злаковых, – в просвет тонкой кишки. Распространенность заболевания составляет 0,5-1,0 % в популяции. Большинство больных являются носителями мутировавшего лейкоцитарного гена DQ2/DQ8. В обзоре обсуждаются современные представления о патогенезе целиакии и классификация Marsh, дополненная Oberhuber. «Золотым стандартом» диагностики целиакии является биопсийное исследование. Диагностически значимыми морфологическими критериями целиакии являются атрофия ворсинок слизистой оболочки тонкой кишки, гиперплазия крипт увеличение числа межэпителиальных лимфоцитов, лимфо-плазмоцитарная инфильтрация собственной пластинки. В плане лечения наиболее эффективна строгая аглютеновая диета, обсуждается возможность применения заместительной ферментной терапии.
...
18 05 2026 6:33:44
Статья в формате PDF
111 KB...
17 05 2026 3:28:29
Статья в формате PDF
113 KB...
16 05 2026 14:19:37
Статья в формате PDF 119 KB...
14 05 2026 5:26:36
Статья в формате PDF
255 KB...
12 05 2026 4:47:50
Статья в формате PDF
118 KB...
11 05 2026 20:31:43
Статья в формате PDF
147 KB...
10 05 2026 18:53:38
Статья в формате PDF
114 KB...
09 05 2026 17:31:40
Статья в формате PDF
126 KB...
08 05 2026 10:26:30
Статья посвящена анализу рынка бытовых услуг Саратовской области. Дается хаpaктеристика объема и структуры потрeбления, места бытовых услуг в системе предпочтений граждан, обеспеченности бытовыми услугами населения городской и сельской местности, анализируется распределение оказывающих бытовые услуги организаций по формам собственности.
...
07 05 2026 6:36:57
В работе исследовалось влияние внутримышечного введения пирацетама на метаболизм коллагена и фосфорно-кальциевый обмен у крыс, подвергавшихся ежедневной тепловой нагрузке по 10 минут в течение 7 суток. Введение ноотропа в дозе 400 мг/кг снижало активность коры надпочечников, ингибировало катаболизм коллагена и стимулировало процессы его синтеза у крыс в условиях тепловой нагрузки, нормализовало уровень кальция в крови. Обсуждаются возможные механизмы действия пирацетама на систему нейро-эндокринной регуляции и состояние костной ткани.
...
05 05 2026 18:28:55
Статья в формате PDF
113 KB...
04 05 2026 6:58:27
Статья в формате PDF
182 KB...
03 05 2026 5:16:46
Статья в формате PDF
154 KB...
02 05 2026 7:20:24
Статья в формате PDF
116 KB...
01 05 2026 9:17:58
30 04 2026 22:21:52
Еще:
Поддержать себя -1 :: Поддержать себя -2 :: Поддержать себя -3 :: Поддержать себя -4 :: Поддержать себя -5 :: Поддержать себя -6 :: Поддержать себя -7 :: Поддержать себя -8 :: Поддержать себя -9 :: Поддержать себя -10 :: Поддержать себя -11 :: Поддержать себя -12 :: Поддержать себя -13 :: Поддержать себя -14 :: Поддержать себя -15 :: Поддержать себя -16 :: Поддержать себя -17 :: Поддержать себя -18 :: Поддержать себя -19 :: Поддержать себя -20 :: Поддержать себя -21 :: Поддержать себя -22 :: Поддержать себя -23 :: Поддержать себя -24 :: Поддержать себя -25 :: Поддержать себя -26 :: Поддержать себя -27 :: Поддержать себя -28 :: Поддержать себя -29 :: Поддержать себя -30 :: Поддержать себя -31 :: Поддержать себя -32 :: Поддержать себя -33 :: Поддержать себя -34 :: Поддержать себя -35 :: Поддержать себя -36 :: Поддержать себя -37 :: Поддержать себя -38 ::