Detail projektu
Výzkum a vývoj korpusových a hlasových technologií v nové generaci elektronických slovníků
Období řešení: 1.6.2006 — 31.12.2009
Zdroje financování
Ministerstvo průmyslu a obchodu ČR - TANDEM
O projektu
Projekt je zaměřen na vývoj nové generace elektronických slovníků s podporou moderních technologií založených na velkých jazykových korpusech s uživatelským přístupem pomocí automatického rozpoznávání řeči. Korpusové postupy byly dosud známy ve vědecké komunitě a pouze postupně začínají pronikat do softwarových produktů distribuovaných přímo uživatelům, totéž platí o hlasových technologiích. Předložený projekt umožní navrhovateli - firmě Lingea - posun state-of-the-art na české i evropské úrovni. Díky tomuto projektu se zhodnotí prostředky dlouhodobě vkládané do výzkumu a vývoje. Na straně spolunavrhovatele - Fakulty informačních technologií VUT v Brně - projekt podpoří významnou výzkumnou skupinu Speech@FIT a posílí uplatnění jejích výstupů v praxi.
Popis anglicky
The project is focused on the development of a new generation of electronic
dictionaries using advanced large language corpora technologies, and on the user
interfaces based on speech recognition. The corpus solutions have so far been
used in the research community and they are only slowly finding their way to the
target applications, the same holds for voice technologies. The proposed project
will allow the R&D group of Lingea s.r.o. a shift in state-of-the-art on the
Czech as well as international levels. It will thus valorize the funds so far
invested into R&D within Lingea. At the cooperating institution - Faculty of
Information Technolology, Brno University of Technology, this project will
support important research group: Speech@FIT and it will facilitate the transfer
of its results to the industrial world.
Klíčová slova
elektronické slovníky, audio korpusy, rozpoznávání řeči, syntéza řeči,
automatická segmentace, detekce klíčových slov, textové korpusy, značkování
korpusů, dolování informací
Klíčová slova anglicky
electronic dictionaries, audio corpora, speech recognition, speech synthesis,
automatic segmentation, keyword-spotting, text corpora, tagging of corpora,
information retrieval
Označení
FT-TA3/006
Originální jazyk
čeština
Řešitelé
Černocký Jan, prof. Dr. Ing. - hlavní řešitel
Útvary
Ústav počítačové grafiky a multimédií
- odpovědné pracoviště (1.1.1989 - nezadáno)
Výzkumná skupina dolování dat z řeči BUT Speech@FIT
- interní (22.9.2006 - 31.12.2009)
Ústav počítačové grafiky a multimédií
- spolupříjemce (22.9.2006 - 31.12.2009)
Výsledky
SZŐKE, I.; GRÉZL, F.; SCHWARZ, P.; FAPŠO, M.: VUT-SW-Search; Modul pro vyhledávání ve slovníku hlasem. Produkt je umístěn na serverech ÚPGM FIT VUT v Brně.. URL: https://www.fit.vut.cz/research/product/125/. (software)
Detail
PEŠÁN, J.; SCHWARZ, P.; GRÉZL, F.: VUT-SW-Pronunciation; Zobrazování výslovností v elektronických slovnících. Produkt je umístěn na serverech ÚPGM FIT VUT.. URL: https://www.fit.vut.cz/research/product/124/. (software)
Detail
ČERNOCKÝ, J.; ŠEVEČKOVÁ, M. Korpusové a hlasové technologie v nové generaci elektronických slovníků - závěrečná technická zpráva. Brno: Ministerstvo průmyslu a obchodu ČR, 2010. s. 0-0.
Detail
FAPŠO, M.; SZŐKE, I.; ČERNOCKÝ, J. Hlasový přístup ke korpusům - experimenty. Brno: Ministerstvo průmyslu a obchodu ČR, 2009. s. 0-0.
Detail
KAŠPAR, M.; ŠEVEČKOVÁ, M.; CHALUPNÍČEK, K.; ČERNOCKÝ, J. Textové a řečové korpusy. Brno: 2009. s. 0-0.
Detail
SZŐKE, I.; FAPŠO, M.; ČERNOCKÝ, J. Hlasový přístup ke korpusům - studie. Brno: Ministerstvo průmyslu a obchodu ČR, 2008. s. 0-0.
Detail
GRÉZL, F.; HRDLIČKA, P.; VESELÝ, K.; CHALUPNÍČEK, K.; ČERNOCKÝ, J.; KOSTKA, M.; PAVELEK, T.; VŠIANSKÝ, J. Vyhledávání slovníkových hesel hlasem. Brno: Ministerstvo průmyslu a obchodu ČR, 2007. s. 0-0.
Detail
CHALUPNÍČEK, K.; ČERNOCKÝ, J.; KOSTKA, M.; PAVELEK, T.; VŠIANSKÝ, J. Automatické hodnocení výslovnosti. Brno: Ministerstvo průmyslu a obchodu ČR, 2007. s. 0-0.
Detail
KAŠPAR, M.; PEŠÁN, J.; SZŐKE, I.; CHALUPNÍČEK, K.; ČERNOCKÝ, J. Technická zpráva k MPO projektu FT-TA3/006: Práce na Etapě 6: Integrace. Brno: Ministerstvo průmyslu a obchodu ČR, 2009. s. 0-0.
Detail
MIKOLOV, T.; KOPECKÝ, J.; BURGET, L.; GLEMBEK, O.; ČERNOCKÝ, J. Neural network based language models for highly inflective languages. Proc. ICASSP 2009. Taipei: IEEE Signal Processing Society, 2009. p. 1-4. ISBN: 978-1-4244-2354-5.
Detail
KOCKMANN, M.; BURGET, L.; ČERNOCKÝ, J. Brno University of Technology System for Interspeech 2009 Emotion Challenge. Proc. Interspeech 2009. Proceedings of Interspeech. Brighton: International Speech Communication Association, 2009. p. 348-351. ISSN: 1990-9772.
Detail
OPARIN, I.; GLEMBEK, O.; BURGET, L.; ČERNOCKÝ, J. Morphological random forests for language modeling of inflectional languages. Proc. 2008 IEEE Workshop on Spoken Language Technology. Goa: IEEE Signal Processing Society, 2008. p. 1-4. ISBN: 978-1-4244-3472-5.
Detail
KOPECKÝ, J.; GLEMBEK, O.; KARAFIÁT, M. Advances in Acoustic Modeling for the Recognition of Czech. Proc. 11th International Conference on Text, Speech and Dialogue. Lecture Notes in Computer Science. Berlin: Springer Verlag, 2008. p. 357-363. ISBN: 978-3-540-87390-7.
Detail
HRDLIČKA, P. Isolated word recognition. Proc. 13th Conference STUDENT EEICT 2007. Brno: Fakulta elektrotechniky a komunikačních technologií VUT v Brně, 2007. s. 1-3. ISBN: 9788021434103.
Detail
VESELÝ, K. Hybrid recognizer of isolated words. Proc. 13th Conference STUDENT EEICT 2007. Brno: Faculty of Electrical Engineering and Communication BUT, 2007. p. 1-3. ISBN: 9788021434103.
Detail
Odpovědnost: Černocký Jan, prof. Dr. Ing.