Rejestracja i obróbka głosu

Nagrywanie głosu oraz wstępne przetwarzanie sygnału w celu uniezależnienia od warunków akwizycji, a także eliminacja ramek nadmiernie zaszumionych lub zawierających ciszę.

Generacja i selekcja cech

Z nagrania głosowego wydobywany jest unikatowy zestaw cech, które umożliwiają dyskryminację głosów poszczególnych mówców.

Tworzenie modelu głosu

Dzięki właściwemu wykorzystaniu cech tworzony jest oszczędny pamięciowo indywidualny model głosu użytkownika stanowiący model odniesienia podczas identyfikacji.

Wybór

Rozpoznawany głos porównywany jest z dostępnymi modelami głosów i podlega przyporządkowaniu do najbardziej podobnego, jeśli spełnia kryterium progu decyzyjnego.

95

Skuteczność [%]

25

Czas nauki głosu [s]

5

Czas weryfikacji [s]

1400

Populacja głosów

Przykłady zastosowania systemu SPEAKFINDER

Identyfikacja osób potencjalnie poszukiwanych
Identyfikacja osób przemawiających podczas dużych spotkań
Przeszukiwanie zarchiwizowanych nagrań głosowych