Detail projektu

Zdroje financování

Ministerstvo průmyslu a obchodu ČR - TANDEM

O projektu

Projekt je zaměřen na vývoj nové generace elektronických slovníků s podporou moderních technologií založených na velkých jazykových korpusech s uživatelským přístupem pomocí automatického rozpoznávání řeči. Korpusové postupy byly dosud známy ve vědecké komunitě a pouze postupně začínají pronikat do softwarových produktů distribuovaných přímo uživatelům, totéž platí o hlasových technologiích. Předložený projekt umožní navrhovateli - firmě Lingea - posun state-of-the-art na české i evropské úrovni. Díky tomuto projektu se zhodnotí prostředky dlouhodobě vkládané do výzkumu a vývoje. Na straně spolunavrhovatele - Fakulty informačních technologií VUT v Brně - projekt podpoří významnou výzkumnou skupinu Speech@FIT a posílí uplatnění jejích výstupů v praxi.

Popis anglicky
The project is focused on the development of a new generation of electronic dictionaries using advanced large language corpora technologies, and on the user interfaces based on speech recognition. The corpus solutions have so far been used in the research community and they are only slowly finding their way to the target applications, the same holds for voice technologies. The proposed project will allow the R&D group of Lingea s.r.o. a shift in state-of-the-art on the Czech as well as international levels. It will thus valorize the funds so far invested into R&D within Lingea. At the cooperating institution - Faculty of Information Technolology, Brno University of Technology, this project will support important research group: Speech@FIT and it will facilitate the transfer of its results to the industrial world.

Klíčová slova
elektronické slovníky, audio korpusy, rozpoznávání řeči, syntéza řeči, automatická segmentace, detekce klíčových slov, textové korpusy, značkování korpusů, dolování informací

Klíčová slova anglicky
electronic dictionaries, audio corpora, speech recognition, speech synthesis, automatic segmentation, keyword-spotting, text corpora, tagging of corpora, information retrieval

Označení

FT-TA3/006

Originální jazyk

čeština

Řešitelé

Černocký Jan, prof. Dr. Ing. - hlavní řešitel

Útvary

Ústav počítačové grafiky a multimédií
- odpovědné pracoviště (1.1.1989 - nezadáno)
Výzkumná skupina dolování dat z řeči BUT Speech@FIT
- interní (22.9.2006 - 31.12.2009)
Ústav počítačové grafiky a multimédií
- spolupříjemce (22.9.2006 - 31.12.2009)

Výsledky

SZŐKE, I.; GRÉZL, F.; SCHWARZ, P.; FAPŠO, M.: VUT-SW-Search; Modul pro vyhledávání ve slovníku hlasem. Produkt je umístěn na serverech ÚPGM FIT VUT v Brně.. URL: https://www.fit.vut.cz/research/product/125/. (software)
Detail

PEŠÁN, J.; SCHWARZ, P.; GRÉZL, F.: VUT-SW-Pronunciation; Zobrazování výslovností v elektronických slovnících. Produkt je umístěn na serverech ÚPGM FIT VUT.. URL: https://www.fit.vut.cz/research/product/124/. (software)
Detail

ČERNOCKÝ, J.; ŠEVEČKOVÁ, M. Korpusové a hlasové technologie v nové generaci elektronických slovníků - závěrečná technická zpráva. Brno: Ministerstvo průmyslu a obchodu ČR, 2010. s. 0-0.
Detail

FAPŠO, M.; SZŐKE, I.; ČERNOCKÝ, J. Hlasový přístup ke korpusům - experimenty. Brno: Ministerstvo průmyslu a obchodu ČR, 2009. s. 0-0.
Detail

KAŠPAR, M.; ŠEVEČKOVÁ, M.; CHALUPNÍČEK, K.; ČERNOCKÝ, J. Textové a řečové korpusy. Brno: 2009. s. 0-0.
Detail

SZŐKE, I.; FAPŠO, M.; ČERNOCKÝ, J. Hlasový přístup ke korpusům - studie. Brno: Ministerstvo průmyslu a obchodu ČR, 2008. s. 0-0.
Detail

GRÉZL, F.; HRDLIČKA, P.; VESELÝ, K.; CHALUPNÍČEK, K.; ČERNOCKÝ, J.; KOSTKA, M.; PAVELEK, T.; VŠIANSKÝ, J. Vyhledávání slovníkových hesel hlasem. Brno: Ministerstvo průmyslu a obchodu ČR, 2007. s. 0-0.
Detail

CHALUPNÍČEK, K.; ČERNOCKÝ, J.; KOSTKA, M.; PAVELEK, T.; VŠIANSKÝ, J. Automatické hodnocení výslovnosti. Brno: Ministerstvo průmyslu a obchodu ČR, 2007. s. 0-0.
Detail

KAŠPAR, M.; PEŠÁN, J.; SZŐKE, I.; CHALUPNÍČEK, K.; ČERNOCKÝ, J. Technická zpráva k MPO projektu FT-TA3/006: Práce na Etapě 6: Integrace. Brno: Ministerstvo průmyslu a obchodu ČR, 2009. s. 0-0.
Detail

MIKOLOV, T.; KOPECKÝ, J.; BURGET, L.; GLEMBEK, O.; ČERNOCKÝ, J. Neural network based language models for highly inflective languages. Proc. ICASSP 2009. Taipei: IEEE Signal Processing Society, 2009. p. 1-4. ISBN: 978-1-4244-2354-5.
Detail

KOCKMANN, M.; BURGET, L.; ČERNOCKÝ, J. Brno University of Technology System for Interspeech 2009 Emotion Challenge. Proc. Interspeech 2009. Proceedings of Interspeech. Brighton: International Speech Communication Association, 2009. p. 348-351. ISSN: 1990-9772.
Detail

OPARIN, I.; GLEMBEK, O.; BURGET, L.; ČERNOCKÝ, J. Morphological random forests for language modeling of inflectional languages. Proc. 2008 IEEE Workshop on Spoken Language Technology. Goa: IEEE Signal Processing Society, 2008. p. 1-4. ISBN: 978-1-4244-3472-5.
Detail

KOPECKÝ, J.; GLEMBEK, O.; KARAFIÁT, M. Advances in Acoustic Modeling for the Recognition of Czech. Proc. 11th International Conference on Text, Speech and Dialogue. Lecture Notes in Computer Science. Berlin: Springer Verlag, 2008. p. 357-363. ISBN: 978-3-540-87390-7.
Detail

HRDLIČKA, P. Isolated word recognition. Proc. 13th Conference STUDENT EEICT 2007. Brno: Fakulta elektrotechniky a komunikačních technologií VUT v Brně, 2007. s. 1-3. ISBN: 9788021434103.
Detail

VESELÝ, K. Hybrid recognizer of isolated words. Proc. 13th Conference STUDENT EEICT 2007. Brno: Faculty of Electrical Engineering and Communication BUT, 2007. p. 1-3. ISBN: 9788021434103.
Detail

Odpovědnost: Černocký Jan, prof. Dr. Ing.

VUT

Fakulty

Vysokoškolské ústavy

Součásti

Výzkum a vývoj korpusových a hlasových technologií v nové generaci elektronických slovníků