Mariusz Kubanek - strona domowa

...

Odnośniki

Politechnika Częstochowska

Wydział Informatyki i Sztucznej Inteligencji

Badania

Badania, którymi się zajmuję dotyczą przede wszystkim sposobów automatycznej analizy, przetwarzania i odpowiedniego kodowania cyfrowych sygnałów akustycznych i wizyjnych, pod kątem wykorzystania ich w systemach biometrycznych, czy też systemach sterujących. Przed obroną pracy doktorskiej zajmowałem się głównie analizą sygnałów mowy, obecnie większą uwagę poświęcam systemom bazującym na cyfrowych obrazach statycznych i dynamicznych, wykorzystywanych w zadaniach autonomicznych i sterujących.

Podsumowanie dorobku naukowo - badawczego przed uzyskaniem stopnia doktora

W zakresie rozpoznawania audio-wideo mowy:

Stworzenie metody AV_Mowa_PL, a także odpowiedniego systemu programowego AVM_PL do rozpoznawania słów izolowanych audio-wideo mowy polskiej, bazujących na fuzji audio i wideo sygnałów (czytania z ruchu warg); jako matematyczne narzędzie do rozpoznawania wykorzystane zostały ukryte modele Markowa.
Opracowanie pomocniczych metod ES i CZS do definiowania początku i końca słów izolowanych audio mowy, a także zbadanie efektu połączenia tych metod dla skrajnych przypadków.
Badanie specyfiki tworzenia wektorów obserwacji audio mowy polskiej za pomocą kodowania współczynników cepstralnych.
Opracowanie metody śledzenia ruchu ust na podstawie metod: detekcji twarzy w oparciu o kolor skóry; lokalizacji oczu i definiowania obszaru ust; stworzonych metod GMIP i CSM do wykrywania kącików i zewnętrznych krawędzi ust.
Opracowanie metody EP do ekstrakcji/kodowania wektorów obserwacji wideo mowy.
Zdefiniowanie i zbadanie efektywności metod Sr, ASr_I i ASr_II fuzji charakterystyk sygnałów audio-wideo mowy.
Dobór struktury i parametrów modeli UMM, a także optymalnego rozmiaru książki kodowej wypowiedzi polskich mówców.
Eksperymentalne udowodnienie większej efektywności identyfikacji użytkownika na podstawie audio-wideo mowy, od identyfikacji na podstawie tylko audio mowy.
Stworzenie bazy AV_BM dla wymagań testowania metody AV_Mowa_PL do rozpoznawania słów izolowanych audio-wideo mowy, zawierającej zbiór komend sterowania systemem operacyjnym, i bazy AV_BI do identyfikacji użytkownika na podstawie audio-wideo mowy.
Przeprowadzenie szeregu badań w celu eksperymentalnego potwierdzenia faktu, iż rozpoznawanie audio-wideo mowy jest szczególnie przydatne w warunkach mocno zakłóconego sygnału audio, dając zdecydowanie mniejszy poziom błędów niż rozpoznawanie w tych samych warunkach samej audio mowy.

Podsumowanie dorobku naukowo - badawczego po uzyskaniu stopnia doktora

W zakresie rozpoznawania audio-wideo mowy:

Opracowanie zmodyfikowanej metody rozpoznawania audio-wideo mowy, przeznaczonej do pracy w warunkach ze znacznie zakłóconym sygnałem audio mowy i pozwalającej na skuteczniejszą pracę systemu w naturalnym, narażonym na hałas środowisku.
Zastosowanie metody sprzężonych ukrytych modeli Markowa do fuzji i synchronizacji sygnałów audio i wideo mowy, umożliwiającej jednoczesną analizę obserwacji audio i wideo w tych samych chwilach czasowych.
Przeanalizowanie dostępnych metod śledzenia twarzy w nagraniu wideo pod kątem optymalizacji przetwarzania na potrzeby systemów pracujących w czasie rzeczywistym.
Opracowanie metody szybkiego i efektownego kodowania kształtu ust wypowiadających poszczególne komendy.
Udowodnienie, że sygnał wideo mowy może być równie przydatny w systemach biometrycznych, jak w przypadku naturalnej konwersacji pomiędzy osobami wspomagającymi się zdolnością czytania z ruchu ust.

W zakresie identyfikacji i weryfikacji tożsamości na podstawie obrazu tęczówki oka:

Wykorzystanie transformaty falkowej do kodowania obrazu têczówki oka, umożliwiające zastosowanie jako narzędzia ucząco-rozpoznającego ukrytych modeli Markowa.
Wykorzystanie ukrytych modeli Markowa do weryfikacji i identyfikacji tożsamości w oparciu o obraz tęczówki oka.
Na podstawie uzyskanych wyników udowodnienie, że w przypadku znacznego pogorszenia jakości obrazów tęczówek, lepszym rozwiązaniem jest zastosowanie do rozpoznawania ukrytych modeli Markowa.

W zakresie weryfikacji i identyfikacji tożsamości na podstawie linii papilarnych palców:

Opracowanie metody klasyfikacji kształtu linii papilarnych palców za pomocą ukrytych modeli Markowa, pozwalającej na znaczne ograniczenie przeszukiwanych zasobów w bazie danych, co w przypadku dużej ilości danych ma niebywałe znaczenie.
Opracowanie metody kodowania kształtu linii papilarnych palców na potrzeby tworzenia wektorów obserwacji.

W zakresie weryfikacji tożsamości na podstawie geometrii dłoni oraz głównych linii papilarnych dłoni:

Opracowanie metody analizy dłoni i detekcji poszukiwanych cech biometrycznych.
Opracowanie metody kodowania głównych linii papilarnych dłoni, pozwalającej na tworzenie wektorów obserwacji o zmiennej długości.
Wykorzystanie ukrytych modeli Markowa do weryfikacji tożsamości na podstawie geometrii dłoni oraz głównych linii papilarnych dłoni oraz dowód wysokich przydatności modeli i łatwości w implementacji.
Udowodnienie, że weryfikacja tożsamości na podstawie geometrii dłoni w połączeniu z głównymi liniami papilarnymi dłoni daje zbliżone wyniki do niezawodnej metody bazującej na cechach szczególnych linii papilarnych palców (przy porównywalnej liczbie użytkowników).

W zakresie weryfikacji tożsamości na podstawie asymetrii twarzy:

Opracowanie metody tworzenia biometrycznego szablonu asymetrii twarzy.
Opracowanie metody kodowania informacji o asymetrii twarzy na potrzeby utworzenia wektora obserwacji o zmiennej długości.
Opracowanie pośrednich algorytmów do detekcji punktów charakterystycznych twarzy.
Wykorzystanie ukrytych modeli Markowa do weryfikacji tożsamości na podstawie informacji o asymetrii twarzy.
Udowodnienie, że informacja o asymetrii twarzy może być wykorzystywana do weryfikacji tożsamości w oparciu o zastosowane ukryte modele Markowa.
Zdefiniowanie i przeanalizowanie możliwości funkcjonowania systemu hybrydowego, wykorzystującego połączone informacje o asymetrii twarzy oraz o barwie głosu analizowanego użytkownika.

W zakresie budowy pojazdów autonomicznych:

Dokonanie weryfikacji istniejących metod i zaproponowanie własnych rozwiązań dla celów wstępnej analizy i przetwarzania obrazów cyfrowych, automatycznej detekcji i kodowania poszukiwanych cech, na potrzeby konstruowania autonomicznych urządzeń.