Detail projektu
IARPA Building Speech Recognition for Keyword Search in a New Language in a Week with Limited Training Data (BABEL) - Babelon
Období řešení: 5.3.2012 — 4.11.2016
Zdroje financování
Neveřejný sektor - Přímé kontrakty - smluvní výzkum, neveřejné zdroje
O projektu
The Babel Program will develop agile and robust speech recognition technology that can be rapidly applied to any human language in order to provide effective search capability for analysts to efficiently process massive amounts of real-world recorded speech. Today's transcription systems are built on technology that was originally developed for English, with markedly lower performance on non-English languages. These systems have often taken years to develop and cover only a small subset of the languages of the world. Babel intends to demonstrate the ability to generate a speech transcription system for any new language within one week to support keyword search performance for effective triage of massive amounts of speech recorded in challenging real-world situations.
Popis česky
Cílem Babel programu je vyvinout agilní a robustní technologii pro rozpoznávání
řeči, která může být rychle aplikována na jakoukoli mluvenou řeč, tak aby
poskytla účinnou vyhledávací kapacitu analytikům pro efektivní zpracování záznamů
velmi objemných souborů dat spontánní řeči.
Klíčová slova
speech recognition, speaker recognition, language recognition, LVCSR, feature
extraction, acoustic modelling, neural-network
Originální jazyk
angličtina
Řešitelé
Matějka Pavel, Ing., Ph.D. - hlavní řešitel
Andrla Petr, Ing. - spoluřešitel
Cipr Tomáš, Ing. - spoluřešitel
Kesiraju Santosh, Ph.D. - spoluřešitel
Novotný Ondřej, Ing., Ph.D. - spoluřešitel
Ondel Lucas Antoine Francois, Mgr., Ph.D. - spoluřešitel
Skála František, Ing. - spoluřešitel
Veselý Karel, Ing., Ph.D. - spoluřešitel
Útvary
Ústav počítačové grafiky a multimédií
- odpovědné pracoviště (20.5.2011 - nezadáno)
Výzkumná skupina dolování dat z řeči BUT Speech@FIT
- interní (20.5.2011 - 4.11.2016)
Raytheon BBN Technologies Corp
- objednatel (20.5.2011 - 4.11.2016)
Ústav počítačové grafiky a multimédií
- příjemce (20.5.2011 - 4.11.2016)
Výsledky
KARAFIÁT, M. 2014 Summary report of project "Processing and analysis of speech, automatic speaker identification". Brno: Raytheon BBN Technologies, 2014. p. 0-0.
Detail
KARAFIÁT, M. Summary report for project "Multilingual speech recognition" in Year 2016. Brno: Raytheon BBN Technologies, 2016. p. 0-0.
Detail
KARAFIÁT, M.; GRÉZL, F.; HANNEMANN, M.; VESELÝ, K. Summary report for project "Multilingual speech recognition" in Year 2015. Brno: Raytheon BBN Technologies, 2015. p. 0-0.
Detail
PLCHOT, O.; BURGET, L.; SZŐKE, I. 2013 Summary report of project "Processing and analysis of speech, automatic speaker identification". Brno: Raytheon BBN Technologies, 2013. p. 0-0.
Detail
BURGET, L.; GLEMBEK, O.; MATĚJKA, P.; PLCHOT, O. 2012 Summary report of project "Processing and analysis of speech, automatic speaker identification". Cambridge: Raytheon BBN Technologies, 2012. p. 0-0.
Detail
VESELÝ, K.; KARAFIÁT, M.; GRÉZL, F.; JANDA, M.; EGOROVA, E. The Language-Independent Bottleneck Features. Proceedings of IEEE 2012 Workshop on Spoken Language Technology. Miami: IEEE Signal Processing Society, 2012. p. 336-341. ISBN: 978-1-4673-5124-9.
Detail
Odkaz
Odpovědnost: Matějka Pavel, Ing., Ph.D.