Основи комп’ютерного зору.
Комп'ютерний зір – теорія і технологія створення машин, які можуть виконувати виявлення, спостереження та класифікацію об'єктів. Як наукова дисципліна, комп'ютерне зір відноситься до теорії і технології створення штучних систем, які отримують інформацію з зображень. Відеодані можуть бути представлені безліччю форм, таких як відеопослідовність, зображення з різних камер або тривимірними даними з медичного сканера. Як технологічна дисципліна, комп'ютерний зір прагне застосувати у теорії та моделі комп'ютерного зору до створення систем комп'ютерного зору вищого рівня. Прикладами застосування таких систем можуть бути: – системи управління процесами (промислові роботи, автономні транспортні засоби); – системи відеоспостереження; – системи організації інформації (наприклад, для індексації баз даних зображень); – системи моделювання об'єктів або навколишнього середовища (аналіз медичних зображень, топографічне моделювання); – системи взаємодії (наприклад, пристрої введення для системи людино-машинного взаємодії). Типові завдання комп'ютерного зору. Кожна з областей застосування комп'ютерного зору, описаних вище, пов'язана з низкою завдань; більш-менш добре певні проблеми вимірювання або обробки можуть бути вирішені з використанням безлічі методів. Розпізнавання. Класична задача в комп'ютерному зорі, обробці зображень і машинному зорі – це визначення містять відеодані про деякий характерний об'єкт, його особливість або активність. Це завдання може бути достовірно і легко вирішене людиною, але до цих пір не вирішена задовільно в комп'ютерному зорі в загальному випадку: випадкові об'єкти у випадкових ситуаціях. Існуючі методи вирішення цього завдання ефективні тільки для окремих об'єктів, таких як прості геометричні об'єкти (наприклад, багатогранники), людські обличчя, друковані або рукописні символи, автомобілі і лише в певних умовах, зазвичай це певне освітлення, фон і положення об'єкта відносно камери спостереження. У літературі описано безліч проблем розпізнавання: – Розпізнавання– один або кілька попередньо заданих або вивчених об'єктів, чи класів об'єктів можуть бути розпізнані, звичайно разом з їх двомірним положенням на зображенні або тривимірним положенням у сцені. – Ідентифікація – це випадок, коли розпізнається індивідуальний екземпляр об'єкта. Прикладом може бути: ідентифікація певного людського обличчя або відбитків пальців, чи автомобіля. – Виявлення – відеодані перевіряються на наявність певної умови. Наприклад, виявлення можливих неправильних клітин або тканин у медичних зображеннях. Виявлення, засноване на відносно простих і швидких обчисленнях іноді використовується для знаходження невеликих ділянок в аналізованому зображенні, які потім аналізуються за допомогою прийомів, більш вимогливих до ресурсів, для отримання правильної інтерпретації. Існує кілька спеціалізованих завдань, заснованих на розпізнаванні, наприклад: – Пошук зображень за змістом – знаходження всіх зображень у великому наборі зображень, які мають певний зміст. Зміст може бути визначено різними шляхами, наприклад в термінах схожості з конкретним зображенням (знайти всі зображення схожі на дане зображення), або в термінах високорівневих критеріїв пошуку, що вводяться як текстові дані (знайти всі зображення, на яких зображено багато будинків, які зроблені взимку і на яких немає машин). – Оцінка положення – визначення положення або орієнтації певного об'єкта у просторі (або у площині) по відношенню до камери. Прикладом застосування цієї техніки може бути сприяння руці робота в добуванні об'єктів зі стрічки конвеєра на лінії складання. – Оптичне розпізнавання знаків – розпізнавання символів на зображеннях друкованого або рукописного тексту, зазвичай для перекладу в текстовий формат, найбільш зручний для редагування або індексації (наприклад, ASCII). Рух. Кілька завдань, пов'язаних з оцінкою руху, в яких послідовність зображень (відеодані) обробляються для знаходження оцінки швидкості кожної точки зображення або 3d сцени. Прикладами таких задач є: – визначення тривимірного руху камери; – стеження, тобто слідування за переміщеннями об'єкта (наприклад, машин або людей). Відновлення сцени. Дано два або більше зображення сцени, або відеодані. Відновлення сцени має завдання відтворити тривимірну модель сцени. У простому випадку, моделлю може бути набір точок тривимірного простору. Більш складні методи відтворюють повну тривимірну модель. Відновлення зображень. Завдання відновлення зображень – це видалення шуму (шум датчика, розмитість руху чи фокусу, і т. д.). Найбільш простим підходом до вирішення цього завдання є різні типи фільтрів, таких як фільтри нижніх або середніх частот, фільтр Гауса, Вінера, тощо. Більш складні методи використовують уявлення того, як повинні виглядати ті або інші ділянки зображення, і на основі цього виконується їх зміна, такі типи відновлення зображень виконуються з використанням аналізу PSF-функції. Більш високий рівень видалення шумів досягається в ході первинного аналізу відеоданих на наявність різних структур, таких як лінії або межі, а потім управління процесом фільтрації на основі цих даних. ©2015 arhivinfo.ru Все права принадлежат авторам размещенных материалов.
|