Основи комп’ютерного зору.

Комп'ютерний зір – теорія і технологія створення машин, які можуть виконувати виявлення, спостереження та класифікацію об'єктів. Як наукова дисципліна, комп'ютерне зір відноситься до теорії і технології створення штучних систем, які отримують інформацію з зображень. Відеодані можуть бути представлені безліччю форм, таких як відеопослідовність, зображення з різних камер або тривимірними даними з медичного сканера. Як технологічна дисципліна, комп'ютерний зір прагне застосувати у теорії та моделі комп'ютерного зору до створення систем комп'ютерного зору вищого рівня. Прикладами застосування таких систем можуть бути:

– системи управління процесами (промислові роботи, автономні транспортні засоби);

– системи відеоспостереження;

– системи організації інформації (наприклад, для індексації баз даних зображень);

– системи моделювання об'єктів або навколишнього середовища (аналіз медичних зображень, топографічне моделювання);

– системи взаємодії (наприклад, пристрої введення для системи людино-машинного взаємодії).

Типові завдання комп'ютерного зору.

Кожна з областей застосування комп'ютерного зору, описаних вище, пов'язана з низкою завдань; більш-менш добре певні проблеми вимірювання або обробки можуть бути вирішені з використанням безлічі методів.

Розпізнавання. Класична задача в комп'ютерному зорі, обробці зображень і машинному зорі – це визначення містять відеодані про деякий характерний об'єкт, його особливість або активність. Це завдання може бути достовірно і легко вирішене людиною, але до цих пір не вирішена задовільно в комп'ютерному зорі в загальному випадку: випадкові об'єкти у випадкових ситуаціях.

Існуючі методи вирішення цього завдання ефективні тільки для окремих об'єктів, таких як прості геометричні об'єкти (наприклад, багатогранники), людські обличчя, друковані або рукописні символи, автомобілі і лише в певних умовах, зазвичай це певне освітлення, фон і положення об'єкта відносно камери спостереження.

У літературі описано безліч проблем розпізнавання:

– Розпізнавання– один або кілька попередньо заданих або вивчених об'єктів, чи класів об'єктів можуть бути розпізнані, звичайно разом з їх двомірним положенням на зображенні або тривимірним положенням у сцені.

– Ідентифікація – це випадок, коли розпізнається індивідуальний екземпляр об'єкта. Прикладом може бути: ідентифікація певного людського обличчя або відбитків пальців, чи автомобіля.

– Виявлення – відеодані перевіряються на наявність певної умови. Наприклад, виявлення можливих неправильних клітин або тканин у медичних зображеннях. Виявлення, засноване на відносно простих і швидких обчисленнях іноді використовується для знаходження невеликих ділянок в аналізованому зображенні, які потім аналізуються за допомогою прийомів, більш вимогливих до ресурсів, для отримання правильної інтерпретації.

Існує кілька спеціалізованих завдань, заснованих на розпізнаванні, наприклад:

– Пошук зображень за змістом – знаходження всіх зображень у великому наборі зображень, які мають певний зміст. Зміст може бути визначено різними шляхами, наприклад в термінах схожості з конкретним зображенням (знайти всі зображення схожі на дане зображення), або в термінах високорівневих критеріїв пошуку, що вводяться як текстові дані (знайти всі зображення, на яких зображено багато будинків, які зроблені взимку і на яких немає машин).

– Оцінка положення – визначення положення або орієнтації певного об'єкта у просторі (або у площині) по відношенню до камери. Прикладом застосування цієї техніки може бути сприяння руці робота в добуванні об'єктів зі стрічки конвеєра на лінії складання.

– Оптичне розпізнавання знаків – розпізнавання символів на зображеннях друкованого або рукописного тексту, зазвичай для перекладу в текстовий формат, найбільш зручний для редагування або індексації (наприклад, ASCII).

Рух. Кілька завдань, пов'язаних з оцінкою руху, в яких послідовність зображень (відеодані) обробляються для знаходження оцінки швидкості кожної точки зображення або 3d сцени. Прикладами таких задач є:

– визначення тривимірного руху камери;

– стеження, тобто слідування за переміщеннями об'єкта (наприклад, машин або людей).

Відновлення сцени. Дано два або більше зображення сцени, або відеодані. Відновлення сцени має завдання відтворити тривимірну модель сцени. У простому випадку, моделлю може бути набір точок тривимірного простору. Більш складні методи відтворюють повну тривимірну модель.

Відновлення зображень. Завдання відновлення зображень – це видалення шуму (шум датчика, розмитість руху чи фокусу, і т. д.). Найбільш простим підходом до вирішення цього завдання є різні типи фільтрів, таких як фільтри нижніх або середніх частот, фільтр Гауса, Вінера, тощо. Більш складні методи використовують уявлення того, як повинні виглядати ті або інші ділянки зображення, і на основі цього виконується їх зміна, такі типи відновлення зображень виконуються з використанням аналізу PSF-функції. Більш високий рівень видалення шумів досягається в ході первинного аналізу відеоданих на наявність різних структур, таких як лінії або межі, а потім управління процесом фільтрації на основі цих даних.

⇐ Предыдущая 1 234 5 6 7 8 9 10 Следующая ⇒