Здавалка
Главная | Обратная связь

Основи розпізнавання образів.



Задача розпізнавання образів полягає в класифікації певної групи об'єктів на основі певних вимог. Об'єкти, що відносяться до одного класу образів, мають загальні властивості. Вимоги, що визначають класифікацію, можуть бути різними, так як в різних ситуаціях виникає необхідність в різних типах класифікацій. Наприклад, при розпізнаванні англійських букв утворюється 26 класів образів. Однак, щоб відрізнити при розпізнаванні англійські букви від китайських ієрогліфів, потрібні лише два класи образів.

Великі можливості сучасної обчислювальної техніки дозволяють у реальному масштабі часу обробляти величезну кількість інформації, що, в свою чергу, робить реальною задачу побудови машин для розпізнавання образів. До теперішнього часу зроблені успішні спроби розробки пристроїв і машинних програм для читання друкарських і машинописних літер, класифікації електрокардіограм, розпізнавання слів з кінцевого словника, виголошених одним і тим же диктором, а також виділення в мові ключового слова, вимовленого різними дикторами. Можна назвати ще ряд інших застосувань розпізнавання образів: ідентифікація людей по фотографії, за відбитками пальців, за типометричними даними, діагностика несправностей в системах, ідентифікація технологічних параметрів, виявлення цілі і так далі.

Найпростіший підхід до розпізнавання образів полягає в зіставленні з еталонами. В цьому випадку деяка безліч образів, зберігаються в пам'яті машини. Досліджуваний образ порівнюється з еталоном кожного класу. Класифікація ґрунтується на заздалегідь обраному критерії подібності (близькості). Такий підхід використовується в ряді пристроїв для читання друкованих літер, однак має кілька недоліків. Головний з них полягає в тому, що в ряді випадків важко вибрати потрібний еталон з кожного класу образів і встановити необхідний критерій відповідності. Ці труднощі особливо суттєві, коли образи, що належать одному класу, можуть значно змінюватися. Типовим прикладом цього є розпізнавання рукописних букв.

Більш досконалий підхід полягає не в порівнянні досліджуваного образу з еталонами, а ґрунтується на порівнянні деяких спеціальним чином проведених замірів вихідного і еталонного образів. Ці відібрані виміри передбачаються інваріантними або малочутливими по відношенню до елементів одного і того ж класу, і далі такі виміри характеризуються як ознаки.

Перше завдання полягає у визначенні того, які вимірювання на вхідному об'єкті можуть грати роль ознак. Слід зазначити, що ознаки можуть мати різну природу і значимість для завдання класифікації, тому відбір ознак та їх впорядкування ґрунтується на важливості цих ознак для характеристики образів або на вплив даних ознак на якість розпізнавання.

Друге завдання розпізнавання образів полягає в класифікації, тобто в ухваленні рішення про належність вхідного образу того чи іншого класу.

Під поняттям образу розуміють впорядковану сукупність дескрипторів, які прийнято називати ознаками. Класом образів – називають сукупність образів, які володіють деякими загальними властивостями. При аналізі класів образів виділяють поняття – число класів, так як машинне розпізнавання образів визначає їх розподілення до тих чи інших класів, що в свою чергу повинно здійснюватись автоматично, або із мінімальним втручанням людини.

У практичних задачах досить розповсюдженими є два типи впорядкованого представлення ознак: у вигляді векторів (кількісний опис) та у вигляді символьних рядків (структурний опис). Образи, представлення яких базується на векторах ознак, позначаються як сукупність елементів матриці X і мають вигляд вето корів-стовпців розміром n×1, де кожна компонента xi представляє дескриптор із номером і, а n – це загальне число дескрипторів, що асоціюються з об’єктом. Також зручним буває представлення образів у вигляді векторів-рядків розміром 1×n, які можна отримати шляхом транспонування векторів-стовпців: XT.

 

 

Природа компоненти вектора Х залежить від підходу, який використовується для опису самого фізичного об’єкта. Можна, як приклад, розглянути задачу автоматичної класифікації буквено-цифрових символів. Дескриптори, які придатні для методу теорії рішень, можуть включати такі величини, як двомірні інваріанти моментів або множину коефіцієнтів Фур’є, що описують зовнішню межу символів.

В деяких додатках характеристики образів зручніше описувати за допомогою структурних зв’язків. Наприклад, в основу розпізнавання відбитків пальців покладено взаємні зв’язки відбитків, які називаються дрібними деталями. Разом з їх відносними розмірами та розташуванням ці ознаки грають роль примітивів, які описують властивості ліній відбитку, такі як обриви, розгалуження, злиття та незв’язані елементи. Задачі розпізнавання такого типу, у яких належність образів до відповідного класу визначається не лише даними кількісних вимірювань ознак, а також просторовими співвідношеннями між ознаками, зазвичай краще вирішуються з використанням структурних методів.

Нижче розглянемо декілька найпоширеніших методів розпізнавання об’єктів, реалізованих на базі пакету прикладних програм Matlab.

Основний принцип розпізнавання, особливо у додатках теорії рішень, заключається у порівнянні образів за допомогою вимірювання відстаней між векторами образів. Таким чином одним з основних методів – це визначення відстаней.







©2015 arhivinfo.ru Все права принадлежат авторам размещенных материалов.