Detail projektu
Rozpoznávání klíčových slov a akcí v audiovizuálních datech
Období řešení: 26.10.2004 — 26.10.2006
Zdroje financování
O projektu
Cílem projektu je automatické zpracování pořizovaných meetingových dat, umožnující uživateli přímé vyhledávání požadovaných událostí v audio/video záznamech podle zvolených kritérií. Aplikačně budou algoritmy také zaměřeny na automatické rozpoznávání řeči s velkým slovníkem. Tvorba navrhovaného robustního a uživatelem použitelného systému závisí na trénování a testování jednotlivých dílčích algoritmů, které jsou však v případě meetingových dat a velkých řečových databází vysoce náročné na výpočetní kapacitu. Projektem navrhovaný cluster je schopen podstatně rozšířit výpočetní kapacitu na naši fakultě a tedy umožnit využití nových metod a postupů v oblasti výzkumu zpracování řečových signálů. Předpokládá se využití clusteru i v jiných oblastech výzkumu v rámci Fakulty informačních technologií.
Popis anglicky
The goal of the project is automatic processing of recorded meeting data, which
would allow to user the direct browsing of required events in acoustic/visual
databases according to selected criteria. Further, proposed algorithms will be
also modified to be used in large vocabulary continuous speech recognition tasks.
Derivation of robust, efficient and by any user utilized system depends on
training and testing of particular algorithms. These algorithms are generally
very computationally expensive, mainly in case of processing real meeting data
and large vocabulary databases. A cluster proposed in this project is able to
significantly increase a computational capacity at our faculty, thus, new modern
algorithms and trends in area of automatic speech recognition can be applied. We
also suppose the utilization of new cluster in other spheres of research activity
at Faculty of Information Technology.
Klíčová slova
rozpoznávání řeči, parametrizace, audiovizuální data, audio-video zpracování,
vyhledávání klíčových slov
Klíčová slova anglicky
speech recognition, feature extraction, meeting data, audio-video processing,
keyword spotting
Označení
119/2004
Originální jazyk
čeština
Řešitelé
Motlíček Petr, doc. Ing., Ph.D. - hlavní řešitel
Útvary
Ústav počítačové grafiky a multimédií
- odpovědné pracoviště (1.1.1989 - nezadáno)
Výzkumná skupina dolování dat z řeči BUT Speech@FIT
- interní (4.11.2004 - 26.10.2006)
Výzkumná skupina počítačové grafiky
- interní (4.11.2004 - 26.10.2006)
Ústav počítačové grafiky a multimédií
- spolupříjemce (4.11.2004 - 26.10.2006)
Odpovědnost: Motlíček Petr, doc. Ing., Ph.D.