Detail projektu

Kvalitativní posun v automatickém rozpoznávání jazyků s využitím streamovaných audio-médií

Období řešení: 19.1.2006 — 19.7.2007

Zdroje financování

O projektu

Projekt je zaměřen na masivní využití streamovaného audia pro kvalitativní posun v úspěšnosti systémů pro automatickou identifikaci jazyka (language identification - LID). Skupina zpracování řeči na Fakultě informačních technologií VUT v Brně (Speech@FIT), jejíž členové projekt podávají, disponuje state-of-the-art systémem pro LID jazyka založeným na akustickém a fonotaktickém modelování. Pro jeho další zlepšení je nutné získat velká množství jazykově závislých dat. V rámci projektu budou tato data získávána z dostupných streamovaných zdrojů (internetová rádia), on-line ukládána, parametrizována a zpracovávána. Bude vyvíjen software pro paralelní trénování modelů pro LID. Získané modely a algoritmy budou evaluovány v rámci mezinárodních kampaní NIST a ve spolupráci s českými bezpečnostními složkami.

Popis anglicky
The projects aims at massive usage of streamed audio for a qualitative improvement of LID (automatic language identification) system accuracy. The speech processing research group at Faculty of Information Technology, Brno University of Technology (Speech@FIT) disposes of a state-of-the-art LID system based on acoustic and phonotactic modeling. For further improvement of its accuracy, it is crucial to gather huge amounts of language-specific data. In the framework of this project, such data will be collected from available streamed sources (Internet radios), on-line stored, parameterized and processed. We will develop software for training of LID models. Resulting models and algorithms will be evaluated in international evaluation campaigns organized by NIST and in cooperation with Czech law enforcement forces.

Klíčová slova
zpracování řeči, identifikace jazyka, paralelní výpočty, získávání řečových dat, streaming

Klíčová slova anglicky
speech processing, language identification, parallel computing, unsupervised acquisition of speech data, streaming

Označení

162/2005

Originální jazyk

čeština

Řešitelé

Černocký Jan, prof. Dr. Ing. - hlavní řešitel

Útvary

Ústav počítačové grafiky a multimédií
- odpovědné pracoviště (1.1.1989 - nezadáno)
Výzkumná skupina dolování dat z řeči BUT Speech@FIT
- interní (17.2.2006 - 19.7.2007)
Ústav počítačové grafiky a multimédií
- spolupříjemce (17.2.2006 - 19.7.2007)

Odpovědnost: Černocký Jan, prof. Dr. Ing.

VUT

Fakulty

Vysokoškolské ústavy

Součásti

Kvalitativní posun v automatickém rozpoznávání jazyků s využitím streamovaných audio-médií