Здавалка
Главная | Обратная связь

Розпізнавання тексту



Етап розпізнавання тексту починається після клацання мишею на кнопці «2.Распознать» і повністю автоматизується. З метою зменшення помилок розпізнавання необхідно правильно встановити мову документа, вибравши її зі списку на панелі інструментів за допомогою миші. Якщо документ містить фрагменти на різних мовах, то потрібні мови вибираються встановленням в списку прапорців напроти відповідної мови.

Процес розпізнавання супроводжується забарвленням текстових і табличних блоків у вікні «Изображение» блакитним кольором. Нерозпізнані символи забарвлюються синім кольором. У ході розпізнавання можуть з'являтися повідомлення з рекомендаціями про додаткові настройки з метою підвищення якості розпізнавання, наприклад провести повторне сканування з підвищеною роздільною здатністю. Після завершення розпізнавання текстовий документ відображається у вікні «Текст».

Невпевнено розпізнані слова в тексті позначено блакитним кольором. Кнопки на панелі «Форматирование» дають змогу перейти до наступного та попереднього невпевнено розпізнаних слів. За необхідності невпевнено розпізнані слова можна відредагувати.

 

5. Редагування та збереження документа.

Відредагувати текст можна, використовуючи панель інструментів «Форматирование». Способи форматування у програмі FineReader подібні до тих, що застосовуються у відомих текстових редакторах, наприклад WordPad, Word 97, Word 2000. Крім того, програма дає змогу перевірити орфографію (кнопка «3.Проверить».

Оброблений документ може бути збережений в буфері обміну або у файлі, пересланий електронною поштою, а також переданий для подальшого оброблення текстовому редактору Microsoft Word або табличному процесору Microsoft Excel. Усі режими можна вибрати з меню, яке викликається на екран після клацання мишею на кнопці «4.Сохранить». Фрагмент вікна програми FineReader із цим меню показано на рис:

Збереження документа є заключним етапом роботи для перетворення в електронний вид.

 

6. Переклад тексту за допомогою програми Plaj-Ruta.

Ідея використання комп'ютера для автоматичного пе­рекладу текстів виникла ще на початку появи ОТ. Для ав­томатичного перекладу документів з однієї мови на іншу розроблено багато різних програм. Однак через складнощі опису семантики природних мов до цього часу остаточно проблему перекладу ще не вирішено.

Значно полегшити роботу з документами можна, користуючись програмним забезпеченням, орієнтованим на автоматичний переклад та автоматичну перевірку правопису. Розробники програмних пакетів пішли ще далі у процесі підвищення зручності для користувача: більшість із цих програм при інсталяції інтегруються в пакет Microsoft Office.

Якщо треба швидко перекласти документ чи фрагмент тексту з російської на українську мову чи навпаки, у кожному з напрямків, доцільно скористатись програмою Plaj-Ruta, що входить до складу пакета програм ProLing Office.

Програмні засоби Рута, Плайфірми ПроЛінгпризначені для перевірки орфографії, граматики текстів українською, російською мовами та їх взаємного перекладу. Вони теж інтегровані в пакет Microsoft Office, їх меню та панелі інструментів показані на рис. нижче.

Вибір команди Рута/Правописание ініціює процес перевірки правопису документу, починаючи з місця, де знаходиться курсор вводу. Діалогове вікно РУТА: Правопис зображене на рис. нижче. Зауважимо, що можна, тримаючи дане вікно відкритим, перемістити курсор вводу далі по тексту, повернутись у вікно і натиснути Продовжити. У цьому випадку перевірка документу буде продовжена з нового місця.

Рута має можливість перегляду даних щодо парадигми слів у вікні, аналогічному до зображеного на рис. Для цього слід вибрати Рута/Парадигма слова.

Російсько-український та зворотній переклади документа чи виділених слів виконує програма Плай. Інтерфейс та порядок дій тут аналогічні до розглянутих вище.

 

7. Переклад тексту за допомогою програми Promt.

Цю програму (її більш ранні версії відомо під назвою Stylus [Стайлус]) розроблено російською фірмою PROMT. Програма є додатком до ОС, таких як Windows 95, 98, NT 4.0, і може бути інтегрована в комплект програм Microsoft Office, зокрема у програми Microsoft Word та Excel.

Можливості програми PROMT:

• забезпечення перекладу документів з англійської, німецької та французької мов на російську і навпаки;

• до неї можна підключати кілька десятків спеціалізо­ваних словників, що забезпечує правильний пере­клад термінів, які стосуються певної області знань;

• динамічне відслідковування напрямку перекладу, тобто визначення мови оригіналу і перекладу;

• переклад вмісту буфера обміну, поточного парагра­фа, виділеного фрагмента тексту або всього тексту;

• забезпечення будь-якого з можливих напрямків пе­рекладу, підключення і відключення словників, до­повнення та виправлення їх, складання списку заре­зервованих слів, які не перекладаються;

• робота безпосередньо з програмами розпізнавання текстів, наприклад FineReader;

• не виходячи з програми можна використати відомі способи редагування і форматування оригіналу та перекладу;

• забезпечення перевірки орфографії оригіналу і пере­кладу після встановлення додатків для перевірки пра­вопису (LingvoCorrector, Пропис, Орфо, Hugo).

Програма запускається або клацанням мишею на значку програми, або за командоюПуск—Программы— PROMT – PROMT.

Після запуску програми відкривається вікно, що складається з трьох областей: дві призначені для відображення оригіналу тексту і його перекладу, тре­тя — утворює інформаційну панель, де відображаються інформація про перекладений документ і спеціальні на­стройки. Є можливість розташувати області початкового тексту і перекладу поряд або одну над одною. Вікно має стандартні елементи вікна Windows 98 — заголовок, рядок меню, панелі інструментів.

Кнопки основної панелі інструментів і панелі інстру­ментів перекладу показано на рис. нижче. За допомогою основного меню та панелей інструментів можна вибрати і виконати будь-яку команду електронного перекладача.

 

1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20

21 22 23 24 25 26 27 28 29 30 31 32 33

Панель інструментів програми перекладу

Кнопки панелі інструментів забезпечують виконання таких дій:

1, 2, 3 — робота з документами (відповідно створити відкрити, зберегти);

4, 5 — зберегти відповідно оригінал і переклад;

6 — перевірити орфографію;

7 — знайти потрібний фрагмент;

8 — спеціальний пошук, знайти зарезервоване(незнайоме) слово або слово з варіантами перекладу;

9, 10 — переставити слово вперед(назад);

11 — переслати документ електронною поштою;

12, 13, 14 — стандартні операції з буфером обміну ( вирізати, копіювати, вставити з буфера);

15 — розширений Буфер Обміну (PROMT Clipboard);

16 — видалити вміст виділених абзаців;

17 — поточний масштаб робочого вікна;

18, 19 — горизонтальне(вертикальне) розбиття документа;

20 — показати/убрати інформаційну панель;

21 — змінити напрям перекладу;

22 — змінити шаблон тематики(«Общий», «Информатика», «Интернет»);

23 — робота зі словарною статтею заданого слова;

24 — список словників, що використовується при перекладі документа;

25, 26, 27 — перекласти черговий, поточний абзац або документ повністю відповідно;

28 — переклад виділених абзаців тексту;

29 — зарезервувати слово;

30 — список слів, що не було розпізнано в процесі перекладу;

31 — залишити виділений абзац без перекладу;

32 — настройка алгоритмів перекладу для активного документа;

33 — показувати варіанти перекладу багатозначних слів.

 

Переклад документа за допомогою програми PROMT передбачає декілька етапів:

1. Введення документа, якій необхідно перекласти. Документ може бути завантажений з файла командою ФайлОткрыть. Необхідний файл вибирають у вікні «Выберите документ», яке за своєю структурою збігається зі стандартним вікном відкривання файла.

Текст для перекладу може бути набраний на клавіатурі у власному редакторі програми. Для цього треба виконати команду ФайлСоздать. Після вибору напрямку перекладу(див. рис) та шаблону тематики в області тексту оригіналу можна ввести необхідний текст.

 

2. Уточнення параметрів перекладу. Після вибору файла відкривається вікно «Конвертировать файл», в якому уточнюється формат тексту оригіналу і визначається напрямок перекладу:

 

 

3. Підготовка тексту до перекладу. Вибраний документ відображається в області тексту оригіналу. Перед початком перекладу доцільно перевірити орфографію, оскільки неправильно написані слова будуть сприйматися програмою як невідомі і залишаться без перекладу. Потім треба відредагувати текст оригіналу, звертаючи увагу на розбит­тя тексту на абзаци. В разі необхідності його можна збе­регти для подальшої роботи як документ PROMT за командоюФайл — Сохранить как....

У документі можуть бути слова і словосполучення, які не повинні перекладатися, наприклад прізвища, назви програмних продуктів (Windows 98, Microsoft Word 2000 тощо). Іноді застосовують транслітерацію — запис із ви­користанням іншого алфавіту, що відповідає написанню або вимові мовою оригіналу (наприклад, прізвище Brown бажано перекласти не як Коричневий, а Браун).

Часом доводиться відмовлятися від перекладу цілих абзаців, наприклад текстів програм на алгоритмічних мо­вах. Щоб відмовитися від перекладу окремих слів, їх тре­ба зарезервувати, тобто встановити на цьому слові курсор, а потім клацнути мишею на відповідній кнопці панелі інструментів або вибрати пунктЗарезервировать... у кон­текстному меню чи менюПеревод. Можна зарезервувати фрагмент тексту, заздалегідь виділивши його.

У вікні «Зарезервировать слово», що буде викликано треба вибрати семантичний клас цього слова (Персоналия, Название, Географическое название, Единица изме­рения) і в разі необхідності задати режим транслітерації:

Перелік зарезервованих слів відображається на інфор­маційній панелі. Окремі слова з нього можна вилучити вибравши відповідний пункт у контекстному меню

Щоб указати на те, що необхідно залишити без пере­кладу абзац, треба встановити текстовий курсор усередині абзацу і клацнути мишею на кнопці «Оставить абзац без перевода» або виконати командуПеревод - Оставить без перевода. Для зняття обмеження на переклад абзацу потрібно повторно виконати ці дії.

У тексті всі зарезервовані слова й абзаци, що мають залишитися без перекладу, виділяють зеленим кольором

Якість перекладу визначається повнотою словників які використовуються, з урахуванням граматичних правил. Для кожного документа можна задати набір словників, які переглядаються у певному порядку до першого виявлення слова для перекладу. Програмою PROMT для перекладу передбачено три типи словників:

генеральний словник (містить загальновживану лекси­ку і побутове значення слів). Він використовується завжди, причому останнім з усіх словників. Зміна цього словника неможлива;

спеціалізовані словники (містять терміни з різних об­ластей знань). Редагувати ці словники не можна але їх можна підключати і відключати під час перекла­ду. Базове постачання програми не містить додатко­вих словників і їх необхідно встановлювати окремо;

• словник користувача (створюється користувачем). До нього додаються слова, яких немає в інших словни­ках, а також уточнені переклади тих або інших слів. Як правило, цей словник переглядають насамперед. Словник користувача можна редагувати.

Список словників, що використовуються під час пере­кладу, відображається на вкладці «Словари» інформаційної панелі. Для підключення додаткових слов­ників можна скористатися менюТематика, контекстним меню на вкладці «Словари» інформаційної панелі або кнопкою панелі інструментів.

При цьому на екрані з'являється вікно «Словари» (див. рис. нижче), в якому після клацання мишею на прапорці напроти відповідної назви словника можна підключити всі потрібні словники.

 

4. Уточнення напрямку перекладу (кнопка «Изменить направление» на панелі інструментів «Перевод» (рис. нижче). Ця дія здійснюється в разі необхідності.

5. Переклад документа. Вибір області перекладу і власне переклад забезпечуються менюПеревод або за допомогою кнопок 25 - 28 на рис. вище (переклад відповідно чергового абзацу, поточного абзацу, всього тексту, виділеного абзацу).

Перекладений документ заноситься в область перекладу. Невідомі слова виділяються червоним кольором, а за резервовані — зеленим. Колірну настройку за бажанням можна змінити за командоюСервис — Параметры... -Цвета. Список невідомих і зарезервованих слів відображається на інформаційній панелі у відповідних укладках У разі необхідності невідомі слова можна занести в словник користувача.

Початковий текст і переклад можна редагувати, форматувати та перекладати повторно.

6. Збереження результатів. Після завершення робіт з текстами оригінал і переклад можна зберегти в одному з форматів що підтримуються програмою, за командами Файл - Сохранить - Исходный текст... і Файл - Сохра­нить - Перевод..., за допомогою яких відкриваються стандартні вікна збереження файла. З метою продовжен­ня роботи над перекладом тексту доцільно зберегти білінгву - двомовний варіант тексту за командоюФайл -Сохранить — Билингву как список абзацев (Билингву как таблицу…).

 

 

Контрольні питання:

1. Як виконати сканування текстового документа?

2. Як виконати сканованого зображення на окремі частини?

3. Як встановити мову розпізнання тексту?

4. Як виконати розпізнання тексту?

5. Як передати документ в програму Microsoft Word?

6. Яке призначення програмних засобів Plaj-Ruta?

7. Як перевірити правопис документа за допомогою Plaj-Ruta?

8. Які можливості має програма PROMT?

9. Яку структуру має вікно програми PROMT?

10. Скільки етапів передбачає PROMT для перекладу документів? Назвіть їх.

11. Як правильно підготувати текст до перекладу?

12. Що означає „зарезервувати слово”?

13. Що таке транслітерація? Як її виконати?

14. Скільки типів словників використовує програма PROMT?

15. Як підключити потрібний словник?

16. Які можливості надає програма PROMT при збереженні результатів?

 
 

 







©2015 arhivinfo.ru Все права принадлежат авторам размещенных материалов.