Polski English |
Ukryte Modele Markowa w Rozpoznawaniu Dwuwymiarowych Wzorców na Obrazach Cyfrowych, Dorobek naukowo – badawczy Moją pierwszą tematyką badań było progowanie obrazów cyfrowych. Klasyczne procedury szybkiej detekcji i/lub rozpoznawania obiektów na scenach niejednorodnych potrzebują segmentacji sceny na jednorodne części – tekstury, to znaczy obszary jednorodne w sensie kryteriów sformułowanych przez badacza. I tylko po segmentacji, można w sposób merytoryczny syntezować algorytmiczne procedury detekcji, rozpoznawania itd. Jednak wiadomo, że procedury segmentacji są procedurami zbyt zasobochłonnymi oraz trudnymi do realizowania w czasie rzeczywistym. W przeciwieństwie do segmentacji, alternatywnym rozwiązaniem są techniki progowania. W przypadku jednorodnych scen wykorzystuje się korelacyjne kryterium Brink’a i entropijne kryterium Pun’a. Jednak rozpoznawanie obiektów na jednorodnych scenach jest przypadkiem dużo prostszym niż spotykane w nowoczesnych technikach rozpoznawanie obiektów na scenach naturalnych w czasie rzeczywistym. Procedura progowania niejednorodnej sceny w celu wydzielania pary „obiekt - tło” posiadającej najlepszy, z pośród możliwych w danej sytuacji, stosunek sygnału do szumu, daje możliwość w większości przypadków uniknięcia procedur segmentacji sceny. Drugim aspektem badań było zapewnienie możliwości automatycznego ustalenia optymalnej wartości progowej dla konstruowania odpowiednich procedur do progowania obrazów. W badaniach przeanalizowano problem czułości znanych kryteriów progowania scen jednorodnych, a także czułości oraz właściwości nowego pseudo-entropijnego kryterium KoJ dla progowania scen niejednorodnych w technikach czasu rzeczywistego. Ponadto opracowano procedurę automatycznego dobierania optymalnej wartości progu. Kolejną tematyką badań w początkowym etapie mojej kariery naukowej było zastosowanie pseudo-entropii w rozpoznawaniu twarzy. W ramach badań opracowano alternatywną metodę rozpoznawania twarzy, wykorzystującą nowatorskie kryterium podobieństwa JeK (opracowane przez prof. Kompanets'a), wykorzystujące pseudo-entropie i jej właściwości. Ważnym aspektem procesu rozpoznawania twarzy jest odpowiedni wybór przestrzeni cech charakterystycznych. Podobnie jak w rozpoznawaniu dowolnych wzorców należy wybrać charakterystyczne właściwości badanego obiektu oraz uniezależnić je od czynników zakłócających i zewnętrznych. W obrazie twarzy wybiera się punkty niezmienne wraz z wiekiem, oraz takie, których nie można zmienić ani zamaskować lub zniekształcić. Do badań zostały wybrane następujące punkty charakterystyczne twarzy: kąciki oczu, kąciki ust oraz ich górny i dolny brzeg, podstawa nosa oraz koniec brody. Wszystkie punkty zostały przeliczone względem nowego układu współrzędnych, którego środek jest w punkcie O. Wyznaczony on jest w następujący sposób: oś Y przebiega prostopadle do środka odcinka między wewnętrznymi kącikami oczu, natomiast oś X jest równoległa do linii poziomej oczu przebiegającej przez wewnętrzne kąciki oczu i przesunięta w dół o długość odcinka między wewnętrznymi końcami oczu. Jednym z ostatnich etapów w procesie rozpoznawania wzorca jest pomiar podobieństwa badanych obiektów. Dotychczas opracowano wiele metod jego pomiaru, zależnych od rodzaju badanej informacji. W eksperymencie wykorzystano ideę porównywania pary obiektów opartą na pseudo-entropijnym kryterium podobieństwa JeK. Głównym znaczeniem zawartym w przedrostku pseudo jest to, że przedstawionym do analizy obiektom informacyjnym dowolnej natury formalnie przypisano właściwości, które posiadają rozkłady prawdopodobieństw obiektów losowych. Jak potwierdziła praktyka, takie podejście okazało się nie tylko efektywnym ale także zawierającym swoją własna problematykę. Jak wykazał eksperyment, opracowana metoda identyfikacji twarzy z wykorzystaniem pseudo-entropijnego kryterium podobieństwa JeK dała zadowalające wyniki. Ponadto charakteryzuje się niską złożonością obliczeniową w stosunku do metod oparty na obliczeniach statystycznych oraz krótkim czasem potrzebnym do klasyfikacji twarzy umożliwia zastosowanie jej w systemach czasu rzeczywistego. Niestety pomimo obiecujących wyników, dalsze prace nad tą metodą identyfikacji osób wykazały znaczny spadek skuteczności wraz ze wzrostem rozmiaru bazy twarzy (powyżej 100). Przyczyną tego były zbyt małe różnice w cechach geometrycznych twarzy miedzy poszczególnymi osobami. Dlatego dalsze badania skierowano w stronę innych metod identyfikacji osób, czego rezultatem była tematyka badań przedstawiona w rozprawie doktorskiej. Praca doktorska Moja praca doktorska dotyczyła biometrii, czyli identyfikacji osób na podstawie cech biologicznych. Postawą mojej pracy doktorskiej była metoda identyfikacji osób w oparciu o fuzję transformacji falkowej i ukrytych modeli Markowa. Wzorcem biometrycznym w tej metodzie był obraz twarzy. Celem badań było opracowanie systemu i komponentów programowych do identyfikacji twarzy reprezentowanej przez jej obraz cyfrowy, w oparciu o fuzje Transformacji Falkowej i Ukrytych Modeli Markowa. Koniecznym wymaganiem do opracowania było udowodnienie eksperymentalne potwierdzające poprawność metody, a także osiągnięcie porównywalnych z istniejącymi systemami poziomu błędów i złożoności obliczeniowej. Ponadto przeprowadzono badania eksperymentalne w celu prawidłowego wyboru odpowiednich wartości parametrów modeli w poszczególnych fazach działania systemu programowego FaMar. Przedstawiona metoda charakteryzuję się nowatorstwem polegającym na wykorzystaniu trzech obszarów twarzy (oczy, nos, usta) do identyfikacji i zbudowaniem dla każdego z nich niezależnego ukrytego modelu Markowa. W porównaniu do innych metod identyfikacji twarzy charakterystyki systemu FaMar są porównywalne. Poziom błędów rozpoznawania za pomocą systemu FaMar wynosi około 8%, podczas gdy poziom błędów istniejących metod waha się 3-16%. Praca była wspierana przez grant promotorski KBN nr 4T11C00425. Detekcja twarzy Pierwszym elementem systemu identyfikacji użytkownika jest zagadnienie detekcji twarzy. Rezultat identyfikacji zależy od skuteczności procedury detekcji i lokalizacji twarzy. Istnieje wiele popularnych metod detekcji twarzy, które można podzielić na dwie grupy: (i) bazujące na detekcji koloru skóry, (ii) wykorzystujące dopasowanie wzorca. Do detekcji koloru skóry wykorzystuje się jeden z modeli barw, np. RGB, HSV, YCbCr, a następnie weryfikuje się czy wybrany obszar jest twarzą. W systemach dopasowania wzorca należy przeszukać cały obraz porównując fragmenty do wzorca. Te metody są czasochłonne i wymagające dużej mocy obliczeniowej. Większość z tych metod nie jest użytecznych w systemach typu on-line lub czasu rzeczywistego ze względu na czas obliczeń. Zaproponowana przeze mnie hybrydowa metoda jest użyteczna w tego typu systemach i daje możliwość budowy i rozwoju praktycznych systemów identyfikacji osób. Wykorzystuje ona elementy wspomnianych metod w taki sposób, aby skrócić czas obliczeń. Po wstępnej selekcji potencjalnych obszarów mogących zawierać twarz, następuje weryfikacja przy wykorzystaniu wzorca oczu, a nie całej twarzy, co znacznie skraca czas obliczeń. Opracowana metoda detekcji twarzy wykorzystuje do wstępnej selekcji obszarów model barw HSV. Badania porównawcze wykazały, że użycie tego modelu barw daje najlepsze wyniki w porównaniu do innych modeli i jest mniej podatny na zmiany typu oświetlenia. Rozpoznawanie mówcy Rozpoznawanie mówcy służące jego identyfikacji lub weryfikacji, jest automatycznym procesem rozpoznania, kto mówi na podstawie sygnału mowy. Systemy biometryczne wykorzystujące unikalną informacje zawarta w głosie człowieka maja zastosowanie w kontroli dostępu, bankowości telefonicznej czy sterowaniu głosem. Systemy rozpoznawania mówcy można podzielić zależne od tego, co mówi człowiek (konieczne jest wypowiedzenie określonej sekwencji słów), oraz niezależne od wypowiadanych słów. W swoich badaniach na identyfikacją mówcy opracowałem metodę rozpoznawania niezależną od wypowiadanych słów. W praktyce oznacza to, że mówca wygłasza dowolny tekst i na podstawie sygnału mowy jest rozpoznawany. Zaproponowana metoda wykorzystuje analizę cepstralną w skali mel oraz wielopoziomową transformacje falkową. Wyniki eksperymentów pokazały, że korzystając z tego rozwiązania, można zbudować skuteczny system identyfikacji mówcy osiągający skuteczność 90 %. Kontrola dostępu do zasobów Kontynuacja moich badań przeprowadzonych w ramach pracy doktorskiej było opracowanie systemu kontroli dostępu do zasobów w czasie rzeczywistym wykorzystującego identyfikacje osób na podstawie obrazu twarzy. System wykorzystuje metodę identyfikacji osób na bazie fuzji transformacji falkowej i ukrytych modeli Markowa. Jednak do tego, aby pracował w czasie rzeczywistym niezbędna była procedura szybkiej detekcji i lokalizacji twarzy na obrazie pochodzącym z kamery. Tutaj przydatne okazały się wyniki moich wcześniejszych badań nad detekcja twarzy. Dzięki dostosowaniu opracowanej wcześniej metody detekcji twarzy powstał zintegrowany system kontroli dostępu do zasobów w czasie rzeczywistym. Recenzje i ekspertyzy W swojej pracy naukowej często występuję w roli recenzenta. Dotychczas zrecenzowałem 17 artykułów w czasopismach: Optica Applicata, Machine Graphics & Vision, Metody Informatyki Stosowanej i Przegląd Elektrotechniczny. Recenzowałem również wnioski na dofinansowanie badań z funduszy europejskich w ramach Programu Operacyjnego Innowacyjna Gospodarka. Na zlecenie Narodowego Centrum Badań i Rozwoju recenzowałem 3 wnioski dotyczące projektu zgłoszonego przez Agencje Bezpieczeństwa Wewnętrznego, a dotyczącego zastosowania nowoczesnych technik biometrycznych w dokumentach tożsamości. Będąc biegłym sądowym wykonuję ekspertyzy zlecane przez organy wymiaru sprawiedliwości. Dotychczas wykonałem ponad 50 ekspertyz na zlecenie takich instytucji jak: Prokuratura Krajowa, Centralne Biuro Śledcze, Prokuratura Apelacyjna w Katowicach oraz sądy i prokuratury. |