Detail předmětu

Zpracování přirozeného jazyka (v angličtině)

FIT-ZPJaAk. rok: 2017/2018

Východiska počítačového zpracování přirozeného jazyka, jazyková data v korpusech, roviny: fonetika, fonologie, morfologie, syntax, sémantika, pragmatika, klasické a formální gramatiky: reprezentace morfologických a syntaktických struktur, reprezentace významu, bezkontextové gramatiky a jejich kontextová rozšíření, gramatiky DCG (Definite Clause Grammars), algoritmus CKY (Cocke-Kasami-Younger), chart-parsing, problém víceznačnosti, počítačové slovníky: reprezentace znalostí o lexikálních jednotkách, typy slovníků, lexikální sémantika, reprezentace významu věty, princip kompozicionality: skládání významů, sémantické klasifikace: valenční rámce, predikáty, ontologie, transparentní intenzionální logika a její aplikace na analýzu významů vět přirozeného jazyka, pragmatika: sémantická a pragmatická povaha jmenných skupin, struktura promluvy, deiktické výrazy, kontexty, porozumění jazyku: význam, inference a reprezentace znalostí.

Jazyk výuky

angličtina

Počet kreditů

5

Nabízen zahraničním studentům

Všech fakult

Výsledky učení předmětu

Studenti se v rámci předmětu seznámí s problematikou počítačového zpracování přirozeného jazyka a naučí se aplikovat základní algoritmy a metody v této oblasti. Porozumí algoritmickému popisu jednotlivých jazykových rovin: morfologické, syntaktické, sémantické a pragmatické a práci se zdroji jazykových dat - korpusy. Pochopí rovněž základní principy reprezentace znalostí, inference a vztahů k umělé inteligenci.

Studenti se naučí řešit týmové projekty. Zdokonalí se v praktickém užívání programátorských nástrojů.

Prerekvizity

Základní znalost programování v C/C++ nebo v některém skriptovacím jazyce (Perl, Python, Ruby)

Způsob a kritéria hodnocení

Hodnocení studia je založeno na bodovacím systému. Pro úspěšné absolvování předmětu je nutno dosáhnout 50 bodů.

  • Zpracování individuálního projektu

Osnovy výuky

    Osnova přednášek:
    1. Úvod, historie oboru, aplikace a obory zpracování přirozeného jazyka
    2. Jak si postavit vyhledávač typu Google, kategorizace textů, podobnost dokumentů
    3. Morfologická analýza na počítači, flektivní a derivativní morfologie, struktura trie pro uložení slovníku
    4. Syntaktická analýza přirozeného jazyka, složkový a závislostní přístup, příznakové struktury, formáty specifikace gramatik
    5. Formalismy pro zápis gramatik, kategoriální gramatiky, systémy LFG, HPSG, LTAG
    6. Metody syntaktické analýzy, algoritmus CKY, chart-parsing
    7. Korpusová lingvistika, stromové korpusy, metoda TBL
    8. Pravděpodobnostní syntaktická analýza, automatické zarovnávání textů, strojový překlad
    9. Lexikální sémantika, slovníky vs. encyklopedie, princip kompozicionality
    10. Transparentní intenzionální logika pro popis významu promluv
    11. Pragmatika, kontextové vazby významu, dynamická sémantika
    12. Reprezentace znalostí, sémantika možných světů, inference
    13. Technologie sémantického webu, ontologie, OWL

    Osnova ostatní - projekty, práce:
    • Individuálně zadávané projekty

Učební cíle

Porozumět počítačovému zpracování přirozeného jazyka a naučit se aplikovat základní algoritmy a metody v této oblasti. Seznámit se s algoritmickým popisem jednotlivých jazykových rovin: morfologické, syntaktické, sémantické a pragmatické a se zdroji jazykových dat - korpusy. Pochopit základní principy reprezentace znalostí, inference a vztahů k umělé inteligenci. Na každé rovině se vždy seznámit s teoretickými východisky, ale i používaným algoritmickým popisem a nástroji. Seznámit se s možnostmi kombinace těchto nástrojů do složitějších systémů.

Vymezení kontrolované výuky a způsob jejího provádění a formy nahrazování zameškané výuky

Kontrolovaná výuka zahrnuje půlsemestrální test, individuální projekt a písemnou zkoušku. Půlsemestrální test nemá náhradní termín, závěrečná zkouška má dva možné náhradní termíny.

Zařazení předmětu ve studijních plánech

  • Program IT-MGR-2 magisterský navazující

    obor MBI , 0 ročník, zimní semestr, povinně volitelný

  • Program IT-MGR-1H magisterský navazující

    obor MGH , 0 ročník, zimní semestr, doporučený kurs

  • Program IT-MGR-2 magisterský navazující

    obor MSK , 0 ročník, zimní semestr, volitelný
    obor MMM , 0 ročník, zimní semestr, volitelný
    obor MBS , 0 ročník, zimní semestr, volitelný
    obor MPV , 0 ročník, zimní semestr, volitelný
    obor MIS , 0 ročník, zimní semestr, volitelný
    obor MIN , 0 ročník, zimní semestr, volitelný
    obor MGM , 0 ročník, zimní semestr, volitelný