Loomulike keelte statistilised mudelid
MTAT.06.013

Aine maht: 3 EAP
Loenguid 2 tundi nädalas
Õpetamise aeg: kevadsemester
Hindamine: arvestus
Eeldusained: ei ole

Sisu lühikirjeldus: Empirism ja ratsionalism keele automaattöötluses. Vajalikud ja lähtemõisted tõenäosusteooriast, informatsiooniteooriast, lingvistikast. Markovi mudelid. Tõenäosuslik grammatika. Annoteeritud keelekorpusele põhinev analüüs. Rakendused.

Kirjandus:
1. Christopher D. Manning, Hinrich Schütze.  Foundations of Statistical Natural Language Processing. MIT Press, 1999.
2. J. Allen. Natural Language Understanding. 2nd ed. The Benjamin/Cummings Publ. Comp., Inc., 1995.  Chapter 7 - Ambiguity Resolution: Statistical Methods
3. Daniel Jurafsky & James H. Martin. Speech and Language Processing. An introduction to Natural Language Processing, Computational Linguistics, and Speech Recognition.  Prentice Hall, 2008 (2000). Vt ka http://www.cs.colorado.edu/~martin/slp.html
4. Liina-Mai Tooding. Andmete analüüs ja tõlgendamine sotsiaalteadustes. Tartu: Tartu Ülikooli Kirjastus, 2007.

Õppematerjalid vt http://moodle.ut.ee



Temaatiline kava

1. Keele automaattöötluse põhiülesanded. Rakendused.
2. Taust: empirism ja ratsionalism keele automaattöötluses.
3. Vajalikud lähtemõisted tõenäosusteooriast. (Ptk. 7.1. J. Allen. Natural Language Understanding. 2nd ed., 1995.)
4. Vajalikud lähtemõisted informatsiooniteooriast.
5. Vajalikud lähtemõisted lingvistikast. Keelekorpused.
6. Kollokatsioonid.  http://nlp.stanford.edu/fsnlp/promo/colloc.pdf
7. Statistiline järeldamine: n-gramm-mudelid. http://www-nlp.stanford.edu/fsnlp/statest/henke-ch6.ppt
(ptk. 4 Daniel Jurafsky & James H. Martin. An introduction to Natural Language Processing, Computational Linguistics, and Speech Recognition. 2nd edition, Prentice Hall)
8. Sõnatähenduste ühestamine.
9. Markovi mudelid. http://nlp.stanford.edu/fsnlp/promo/hmm-chap.ps
10. Sõnaliikide märgendamine.
11. Tõenäosuslikud kontekstivabad grammatikad.  http://www-nlp.stanford.edu/fsnlp/pcfg/fsnlp-pcfg-slides.pdf
(ptk. 7.5. J. Allen. Natural Language Understanding. 2nd ed., 1995)
 


2012./2013. õ.-a. kevadsemester

Loengud esmaspäeviti kell 14-16 Liivi 2-404.
Kontrolltöö 13. mail. Materjale võib kasutada.    Kordamisküsimused

Kodused ülesanded

Arvestuse saamiseks lahendada kõik kodused ülesanded ja sooritada kontrolltöö.


Parandused ja täiendused: mare.koit at ut.ee
Loodud detsembris 2005, viimati muudetud 3. mail 2013
<== Keeletehnoloogia töörühm