Принципи роботи електронного перекладача
Вступ
За останні роки на ринку програмного забезпечення з»явилось кілька десятків програм машинного перекладу текстів з одної мови іншою. Спробуємо проаналізувати останні версії найбільш популярних із них.
Програми перекладу (системи машинного перекладу) з»явилися у відповідь на потреби користувачів в оперативному перекладі різної комерційної, технічної або INTERNET-інформації, яка подана в електронному вигляді. Крім перекладу з іноземних мов, важливе значення має переклад з української (російської) мови іншими мовами, зокрема англійською. Аналізуючи програми машинного перекладу, потрібно відразу уточнити, що вимоги до них не повинні бути такими ж, як і до перекладу, який виконує людина. Переклад, зроблений комп»ютером, поки що далеко не ідеальний, але текст, отриманий в результаті роботи електронного перекладача, дозволяє в більшості випадків зрозуміти суть документа, який перекладався. Далі цей документ можна корегувати, маючи базові знання іноземної мови та добре орієнтуючись в предметній галузі, до якої належить інформація, що перекладається.
Одними з найбільш відомих програм машинного перекладу на ринку України є STILUS, ПАРС, Language Master. Ці програми-WINDOWS-додатки, які підтримують технологію Drag&Drop, OLE-автоматизацію, мають оперативну довідкову систему, графічну діалогову настройку, а також інші елементи управління вікнами та опціями, що робить ці програми справді популярними серед користувачів.
1. Основні аспекти електронного перекладу тексту
Розглянемо критерії, за якими порівнювались вказані вище програмні продукти.
- Інсталяція/Деінсталяція характеризує можливість установки та знищення програм машинного перекладу з комп»ютера користувача.
- Швидкість перекладу визначає, наскільки швидко можуть бути перекладені текстові документи великих розмірів.
- Кількість неперекладених слів характеризує словники, які супроводжують програми машинного перекладу.
- Якість перекладу визначає граматичну коректність перекладу.
- Зручність настройки програми та словників визначає дружелюбність інтерфейсу користувача.
- Використання у мережі засвідчує можливість застосування програми-перекладача для колективної роботи.
- Документація дозволяє отримати первісні поняття та теоретичні знання про програму.
- Робота з Web-браузером дає можливість виконувати оперативний переклад Web-сторінок.
Слід сказати, що, незважаючи на велику кількість критеріїв, головним залишається, безумовно, якість перекладу, тому цей критерій є найбільш вагомим в підсумковій оцінці. Розглянемо по черзі три перекладача.
STILUS 3.01. Серед усіх програм машинного перекладу, що розглядаються, STILUS 3.01 є найбільш відомим поміж користувачів. Ця програма входить до складу офісного пакету Stilus Lingvo Office.
У новій версії цієї програми значно розширено набір команд перекладу у Word та Excel, підтримку можливостей перекладу поточного абзацу, виділеного тексту, усього тексту, завантаження документа, що редагується у STILUS. Крім цього, у новій версії є можливість, не завантажуючи STILUS, використовувати будь-який з напрямів перекладу, що є у розпорядженні, підключати та відключати спеціалізовані словники, поповнювати та корегувати їх, добавляти слова до списку зарезервованих слів і переглядати список незнайомих слів та словосполучень.
Наразі STILUS динамічно відстежує напрямок перекладу. Наприклад, якщо текст перекладався з російської мови англійською, а потім виникла потреба в перекладі англійського тексту, то STILUS це помітить і змінить напрямок перекладу на потрібний, попередньо запросивши підтвердження. Ця програма машинного перекладу вирізняється можливостями настройки всієї системи, якістю перекладу та супроводжувальною документацією. У цьому перекладачі з меню можна вибирати словники потрібного напрямку перекладу для мовних пар: англо-російська, російсько-англійська, німецько-російська, російсько-німецька, французько-російська та російсько-французька.
Для роботи з цією програмою необхідно мати комп»ютер з процесором 386DX та вище, оперативною пам»яттю 8M (рекомендується 16M) і інстальованою операційною системою Windows95 чи WindowsNT 3.51 (русифікована версія).
Таким чином, маємо потужну програму машинного перекладу, яка підтримує технології Windows та MS Office і забезпечує придатну на сьогодняшній час якість перекладу.
ПАРС 3.9. Програма машинного перекладу ПАРС 3.9 для Windows являє собою подальший розвиток ПАРС для DOS, працює як Windows-додаток та сумісна з широковідомими текстовими редакторами.
Цей перекладач використовує 386-й захищений режим процесора (тобто підтримує мультизаданість). Переклад текстів, підготовлених у популярних текстових редакторах, виконується із збереженням формату тексту (шрифтів, таблиць, абзаців, відступів та ін.). ПАРС забезпечує зв»язний переклад всередині предметних галузей, охоплених словниками, та підтримує англо-російські словники і російський граматичний словник. Користувачі можуть підключати словники, створювати нові словники самостійно та змінювати існуючі безпосередньо з Word. Загальний обсяг словників понад 700000 слів. Завантаження програми здійснюється безпосередньо з Word автоматично чи за бажанням користувача. У процесі перекладу ПАРС дозволяє використовувати до чотирьох словників із установленням їх пріоритету, причому надає можливість здійснювати переклад усього тексту чи його фрагмента, уводити нові слова чи словосполучення прямо в словник з тексту, відокремлювати багатозначні слова в тексті перекладу зірочками, що дозволяє швидко та легко вибирати значення, що більше підходить. Ця програма вирізняється зручною та різнобічною настройкою словників користувача.
Документація, що супроводжує програму, дозволяє швидко зрозуміти принципи роботи цього електронного перекладача.
Для коректної роботи ПАРС необхідно таке апаратне та програмне забезпечення: комп»ютер з процесором 386DX і вище, оперативна пам»ять 2М (рекомендується 4М), операційне середовище Windows 3.x чи операційна система Windows 95, текстовий редактор Word для Windows.
Отже, маємо хорошу, швидкодіючу програму машинного перекладу із зручними можливостями поповнення словників та пріоритетністю їх використання.
Language Master 5.5. Однією з програм машинного перекладу, яка нещодавно з»явилась на SOFT-ринку України, можна вважати Language Master. Наразі ця програма-перекладач призначена для підготовки текстів українською, російською та англійською мовами або їх комбінаціями.
Схема роботи цієї програми базується на орфографічній перевірці початкового тексту, обліку граматичних та семантичних особливостей побудови речень. Для цього використовуються модуль орфографічної перевірки (Спелчекер) та електронний словник (Асистент), перекладач документів та модуль перекладу для мовної пари. Ця програма машинного перекладу підключається до будь-якої версії Word для Windows, тобто не має власної оболонки. Це, можливо, є причиною низької швидкодії даного перекладача.
У панелі інструментів Word при установці з»являються одразу чотири додаткові кнопки програми Language Master, використовуючи які можна керувати процесом перекладу і здійснювати настройку програмного забезпечення. Крім того, у рядку меню з»являється підменю Master, з якого також можна керувати настройкою та процесом перекладу.
Надана документація (українською мовою) містить корисні попередження та поради, незважаючи на свій невеликий обсяг.
Для безперебійної роботи Language Master потрібні комп»ютер на базі 486DX та вище, оперативна пам»ять 4М (рекомендується 8М), операційне середовище Windows 3.x або операційна система Windows 95 чи WindowsNT, текстовий редактор Word для Windows.
Таким чином, існує програма машинного перекладу, що швидко розвивається, але не має власної оболонки, що, можливо, обумовлює вади та обмеження в роботі з нею.
Далі наведемо результати тестування вищеназваних програмних продуктів (див. табл. 1). Для експерименту застосовувався комп»ютер на базі процесора Pentium-200 з оперативною пам»яттю 32М, файли вихідного тексту розміром 6К та п»ятибальна шкала оцінок.
В оцінці якості перекладу враховувались граматичні, синтаксичні та стилістичні оцінки з рівною вагою.
Тепер зупинимось більш конкретно на вадах отриманих перекладів. Як вже зазначалось вище, варіант машинного перекладу є лише початковим матеріалом, звичайно, дуже недосконалим, який обов»язково підлягає подальшій ретельній обробці. Зупинимось детальніше на деяких вадах одержаних перекладів з англійської. Як відомо, деякі англійські іменники і дієслова мають однакове написання та транскрипцію, або трохи відрізняються за вимовою, що, звісно, для письмового перекладу неважливо. Їх морфологічну належність визначає або артикль (для іменників), або частка «to» (для дієслів). Тому, коли ці визначники присутні в тексті, машинний перекладач дає більш-менш адекватний український (російський) еквівалент. Якщо ж іменник (наприклад, «work») вжито без артикля, або дієслово стоїть після модального дієслова («can»,»must» та ін.) і не потребує частки «to», можливі хибні варіанти перекладу. Наприклад, англійському «must work» відповідає в усіх трьох перекладених текстах російське неправильному «должны работа». Ця проблема може бути усунена. Для цього текстовий аналізатор має враховувати, що після модального дієслова безпосередньо можуть стояти лише різні форми інфінітива (за винятком простих відповідей на зразок «I can»). Поширимо наш вираз до «must work hand in hand». Як показало тестування, знову маємо незадовільний переклад останніх трьох слів, адже проблема і тут стосується розпізнання іменника «hand» та фразового дієслова «hand in». Одержали такі варіанти перекладів російською мовою «рука в руке» (STYLUS 3.0), «вручают руку» (ПАРС 3.9) та українською «пліч-о-пліч» (Language Master 5.5). Зрозуміло, що правильним є тільки останній переклад. До речі, артиклі в англійському тексті звичайно не викликають ускладнень у розумінні змісту, адже з контексту здебільшого зрозуміло, що мається на увазі в оригіналі: «a company» — будь-яка компанія або ж «the company» — та конкретна компанія, про яку йшлося вище. Машинні перекладачі припускаються помилок у розумінні англомовної конструкції «complex object», якій в більшості випадків відповідає складнопідрядне речення. Так, фразу «to enable Europe to become one community» можна перекласти «зробити можливим, щоб Европа стала єдиною спільнотою» або «допомогти Європі стати єдиною спільнотою». З першим варіантом перекладач впорається, якщо навчити його формувати підрядне речення, підметом якого є додаток (у нашому випадку «Europe») конструкції «complex object».
Таким чином, машинні перекладачі текстів більш-менш задовільно складають скелет майбутнього перекладу за рахунок, як правило, дослівної обробки тексту, причому з кількох можливих значень слів обирається частіше за все загальновживане. Така ситуація навряд чи зможе задовольнити фахівця певної галузі.
Зупинимось на перекладі в зворотному напрямку. На відміну від української (російської), англійська мова не є мовою флексій. Останні залишились тільки у двох випадках, а саме: для позначення множини іменників («dog»-«dogs») та присвійного відмінка («a girl»s dall»), але зміст речення цілком однозначно визначається строгим порядком слів у реченні (підмет-присудок-другорядні члени). Тому не виникає проблеми у визначенні програмою машинного перекладу об»єкта та суб»єкта дії. Навпаки, українська (російська) мова припускає довільний порядок слів у реченні відповідно до логічного наголосу. Викликають труднощі, наприклад, звороти такого типу «разъяснить, что обозначают аббревиатуры такого типа»(рос.). У підрядному реченні російське «что» може виступати або як відносний займенник, і в цьому випадку він є додатком до складнопідрядного речення та перекладається англійським «what», або як сполучник, тому перекладається англійським «that». Програмне забезпечення, що розглядається, цих ситуацій не розрізняє і переклало цей вираз через «that», що є, звичайно, помилковим.
Звертає увагу неправильний переклад англійських усталених зворотів, зокрема, зловживання прийменником «of» родового відмінка замість того, щоб знаходити більш природні еквіваленти. Так російському словосполученню «Министерство обороны» скрізь відповідає «the Ministry of[the|a|без артикля] defense», тимчасом як правильним було б «the Defense Ministry».
Ще однією проблемою, яку неможливо обминути, є правильне відображення колокацій, слів, що завжди вживаються поруч. Із двох фраз «the war breaks out» та «the war irrupts» англієць віддасть перевагу другій, але програми-перекладачі не відстежують такі ситуації.
Отже, в першому наближенні до цієї проблеми можна вирізнити два напрямки вдосконалення якості машинного перекладу: програмний та технічний. Програмний напрямок має за мету вдосконалення SOFT-забезпечення, тобто самого алгоритму програми, створення механізму системи, що самонавчається; технічний — розширення бази словників, усталених словосполучень та зворотів, а також диференціацію перекладачів за різною тематикою, реалізацію різних принципів відбору слів (статистичного, тематичного, контекстного).
У будь-якому випадку користувач повинен володіти мовою хоча б на початковому рівні, щоб самостійно завершити переклад. Взагалі не має сенсу говорити про успіх таких програм без плідної співпраці у їх створенні фахівців високого класу як в галузі прикладної математики, так і в галузі мовознавства.
2. Електронні словники та системи перекладу в Інтернеті
Існує два типи електронних перекладачів: Transfer і Interlingua. Поки використовується тільки перший варіант, так як другої ще немає у продажу. Принцип його дії полягає в тому, що він аналізує введені слова і нескладні словосполучення, з подальшим перекладом на зазначену мову. Потім перекладені слова складаються в пропозиції …
Природно, що така система недосконала. Головна проблема подібних програм – нездатність зрозуміти і видати точний переклад, а також скласти точну пропозицію.
Дані електронні перекладачі можна легко розпізнати. Вони видають неузгоджені закінчення, а також часткова відсутність сенсу. Іноді переклад виходить взагалі без сенсу.
Але є програма, яка з такою проблемою справляється – це Interlingua. Але де її взяти? У вільному побуті таких програм немає. Ці системи в кілька разів складніше першого варіанту. Крім того, з ними нелегко працювати, для цього потрібні люди, які пройшли спеціальне навчання.
Принцип роботи даних систем заснований на використанні проміжного мови. Наприклад, Ви вводите текст, а він спочатку описується засобами проміжного мови, після чого видає переклад потрібної мови. Сенс полягає в тому, що переклад робиться не безпосередньо, а через іншу мову.
Передбачається, що такий переклад буде до того якісним, що його можна порівняти з перекладом живої людини. Це багаторічний проект компанії Microsoft, яка оголосила про запуск цієї програми, але поки тільки для тестування.
Для тестування було вибрано декілька бюро перекладів. Якщо випробування пройдуть успішно, через кілька років дана програма повністю замінить людину, роблячи письмові переклади.
У цьому запевнило керівництво компанії. Але це поки тільки слова, в реальності може нічого не вийти. Можна згадати аналогічний приклад, коли навколо Windows Vista був жвавий ажіотаж і численні реклами. У кінцевому рахунку, дана операційна система себе не виправдала.
Але все-таки одне з корисних електронних пристроїв – це кишеньковий перекладач. У нього вводяться слова чи речення, а він видає переклад на необхідному мовою. Крім того, він може служити замість записника. У кишенькового електронного перекладача є й інші корисні функції.
Перші комерційні продукти машинного перекладу, що знайшли практичне використання, з’явилися в середині 80-х років. Вони були реалізовані на персональних комп’ютерах і були системами прямого перекладу, можливості яких базувалися на величезних (в порівнянні з першими системами) словниках, а не на умінні аналізувати і синтезувати тексти.
Однокористувальницька «коробкова» версія продукту Retrans Vista фірми «Віста текнолоджіз» призначена для автоматизованого перекладу текстів з російської мови на англійську і назад. У ній використані оригінальні алгоритми стиснення словникових баз та пошуку перекладних еквівалентів, що дозволяють транслювати «на льоту» не тільки фрагменти тексту, імпортовані з текстового редактора MS Word, але і Web-сторінки.
У словниках Retrans Vista зберігаються мільйони понять, до яких належать не тільки традиційні стійкі фразеологічні звороти, але, перш за все, словосполучення, використовувані в повсякденній мові. Крім того, є програма концептуального аналізу, автоматично виділяє з тексту нові словосполучення і включає їх до словника. Основні словники системи Retrans Vista містять терміни і фразеологічні одиниці з природничих і технічних наук, економіці, бізнесу та політиці. Обсяг політематичного машинного словника — близько 3,4 млн. слів (1,8 млн. у російсько-англійської частини, 1,6 млн. — в англо-російської), причому 20% з них є словами, а 80% — стійкими словосполученнями з середньою «довжиною» в 2,2 слова.
Фірма ПРОМТ (http://www.promt.ru/rus1/news/news.htm) розробила і постачає Інтернет-перекладач PROMT Internet Translation Server, що забезпечує переклад «на льоту» Web-сторінок, запитів до пошукових систем або до баз даних , представленим в Інтернеті.
Модуль перекладу PROMT Internet вбудовується в браузер Microsoft Internet Explorer, утворюючи засіб для синхронного перекладу Web-сторінок Web View. При цьому можна встановлювати для перекладу різні мовні пари: англійська — російська, англійська — німецька, англійська — іспанська; французька — англійська; французька — німецька.
З практичної точки зору, маючи на увазі якість результуючого тексту і його відповідність вихідного, програми машинного перекладу поділяють на три категорії:
- повністю автоматичний переклад;
- автоматизований машинний переклад з участю людини;
- переклад, здійснюваний людиною з використанням комп’ютера.
Програми машинного перекладу першою з названих категорій є справою далекого майбутнього, оскільки в загальному вигляді не вирішені проблеми автоматичного розуміння, перекладу і синтезу текстів.
Програми другої категорії розробники називають МТ-програми (від Machine translation — машинний переклад). Реально автоматизований (за участю людини) машинний переклад можливий тільки в умовах штучно обмеженого, як по словникового запасу, так і з граматики, мови.
Як реальний успішного проекту МТ-програми часто називають німецьку систему Meteo, що виконує переклад метеопрогнозів з французької мови на англійську і назад.
До МТ-програм відносяться і продукти машинного перекладу фірми ПРОМТ, згадані вище, у тому числі програми для перегляду вмісту Web-сторінок в мережі Інтернет з метою пошуку потрібного документа.
Програми третьої категорії розробники називають ТМ-програми (від translation memory — пам’ять перекладу). Цю категорію програм застосовують професійні перекладачі, які усвідомили виграш від автоматизації їх роботи за допомогою комп’ютерів. Основу ТМ-програм становлять спеціалізовані словники, що відповідають тематиці тексту перекладу. При перекладі використовуються конструкції і значення слів і стійких словосполучень, вибрані професійним перекладачем і занесені у словники системи, а отриманий текст піддається інтенсивному редагуванню. Словники і вже перекладені фрагменти текстів, запам’ятовуються в ТМ-системі, можуть бути повторно використані у великих колективних проектах, ними можна обмінюватися. Тому ТМ-системи являють собою важливий засіб автоматизації праці професійних перекладачів.
Часто ТМ-програми використовують у поєднанні з МТ-програмами. Найбільш популярним у світі ТМ-інструментарієм є Translation’s Workbench фірми Trados (для стислості часто також званий Trados).
Історія машинного перекладу налічує трохи більше 50 років. За цей час змінилося кілька поколінь систем машинного перекладу — від перших програм, які використовували обмежені ресурси універсальних комп’ютерів першого покоління до сучасних комерційних продуктів, що використовують потужні ресурси серверів і персональних комп’ютерів, включаючи ПК, в яких можна розміщувати кишенькові словники, а також комп’ютерні мережі.
У міру зняття технічних обмежень, що накладаються можливостями комп’ютерів за продуктивністю і пам’яті, ставало ясно, що проблема перекладу тексту з однієї природної мови на іншу принципово не зводиться тільки до перекодуванні слів. Для подолання основних труднощів проблеми машинного перекладу повинні бути вирішені завдання автоматизованого подання контексту, смислового змісту тексту, що перекладається, знань про поняття предметної області, до якої належить перекладається текст.
Разом з тим сучасні досягнення в області обчислювальної техніки, інформаційних технологій і технологій телекомунікацій дозволяють висувати на перспективу практичні завдання пошуку та вибору необхідної інформації, представленої на різних мовах, з різнорідних джерел, що знаходяться в корпоративних і глобальних інформаційно-телекомунікаційних мережах.
Як приклад такої перспективної задачі можна навести системи запитів до інформаційних ресурсів мереж, наприклад до баз даних, з можливістю формування відповідей по телефону у вигляді усного мовлення. Для цього потрібне поєднання систем машинного перекладу з системами розпізнавання і синтезу мови.
Висновки
Переклад незмінно розглядається як спосіб забезпечити спілкування між різномовними комунікантами шляхом відтворення на іншій мові повідомлення, що міститься у вихідному тексті. У найбільш загальному плані мовознавці зазвичай визначали переклад як заміну тексту на одній мові текстом іншою мовою і лише, потім приступали до вивчення вимог, яким повинен задовольняти створюваний текст, щоб служити повноцінною заміною оригіналу, і відносин, що виникають між текстами оригіналу та перекладу в цілому і між окремими частинами та одиницями цих тестів. Отже, лінгвістична теорія перекладу вивчає співвідношення одиниць двох мов не ізольовано, а в текстах певного типу (оригіналах та їх перекладах), і всі дані, якими ця теорія має в своєму розпорядженні, отримані з порівняльного вивчення таких текстів.
У той час як основна трудність перекладу художньої прози полягає в необхідності інтерпретації намірів автора, тобто у передачі не тільки зовнішніх фактів, але й у збереженні психологічних та емоційних елементів, закладених в тексті, завдання, що стоїть перед перекладачем науково-технічного тексту, позбавленого емоційного забарвлення, є більш простою — точно передати думку автора, лише по можливості зберігши особливості його стилю . Інакше кажучи, адекватний переклад досягається, перш за все, через збереження предметно-логічного значення вихідного тексту.
Список використаної літератури
- Алексєєва, І.С. Введення в перекладознавство [Текст]: навч. посібник / І.С. Алексєєва. — М.: Академія, 2004. — 347 с.
- Алексєєва, І.С. Професійний тренінг перекладача [Текст]: навч. посібник / І.С. Алексєєва. — М.: Союз, 2004. — 288 с.
- Ачкасов, А.В. Мова — культура — переклад [Текст] / А.В. Ачкасов / / Російська мова в школі. — 2003. — № 5. — С.89-91
- Базилєв В.М. Пошук змісту в практиці перекладача / / Сенс і вираз: контроверзи сучасного гуманітарного знання. — Самара: Видавництво 21 століття, 2001. — С. 233-235.
- Бєлов Ю.А., Проценко В.С., Чаленко П.Й. Інструментальні засоби програмування.—К.: Либідь, 1993.
- Гудмэн Дж. Управление памятью для всех. —К.: Диалектика, 1995.
- Зелинский С. Английский бы выучил только за то … // CHIP. Компьютерный журнал. —1997.—№ 11.—C. 50—56.
- Чуковський, К.І. Високе мистецтво [Текст]: навч. посібник / К.І. Чуковський. — М.: Азбука-классика, 2008. — 448 с.
- Шеремінская, Л.Г. Настільна книга перекладача [Текст]: навч. посібник / Л.К. Шеремінская. — М.: Фенікс, 2008. — 256 с.