MTAT.06.031 Süntaksiteooriad ja -mudelid



Eesmärk: Saada ülevaade tähtsamatest süntaksiteooriatest. Õppida programmeerima ja testima loomuliku keele süntaksianalüsaatorit nii reeglipõhiseid kui statistikapõhiseid meetodeid kasutades.

Kirjeldus: Põhilised süntaksiteooriad - fraasistruktuurigrammatika ja transformatsioonigrammatika. Chomsky grammatikate hierarhia. Loomuliku keele süntaksianalüüs reeglipõhiste ja statistiliste meetodite abil. Peajuhitav fraasistruktuurigrammatika (HPSG). Leksikaalfunktsionaalne grammatika (LFG). Sõltuvusgrammatika. Kitsenduste grammatika. Reeglipõhise parseri kirjutamine. Süntaktiliselt märgendatud tekstikorpused. Puude pangad (treebank). Puude pankade loomise ja kasutamise tarkvara. Statistikapõhise parseri treenimine süntaktiliselt märgendatud korpusel.

Punktid:

Loengud neljapäeviti 16-18 Liivi 2-315, praktikumid reedeti 14-16 Liivi 2-205

Kodutööd

Eksam: 1.juuni või 14. juuni kl 12-16, ruumis 315. ÕISis lõppeb eksamile registreerumine 7 päeva varem!

Esialgne kava:




1

09.02. L

Ülevaade kursusest.
Põhimõisted. Teooriate liigitus. (slaidid)
Lugemine: F. Karlsson. Üldine keeleteadus ptk 1.3.4.; 5.


10.02. P

Süntaksianalüüsi vahendid veebis

Xerox, VISL, FDG, LinkGrammar, LFG, Babel (HPSG)

2

16.02. L

Kontekstivabad grammatikad. DefiniteClauseGrammar

Kirjandus: Tõnu Tamme. Loogilise programmeerimise meetod. ptk 8.

Detmar Meurers. Introduction to CL I. Course material. ch 4, 5.

Näiteprogrammid: 1, 2, 3, 4, 5, 6, 7, 8.


17.02. P

DCG

3

23.02. L

Vabariigi aastapäevale eelnev lühendatud tööpäev


24.02. -

Vabariigi aastapäev

4

02.03. L

Sõltumis-sidumisteooria (GB)


03.03. P

DCG jätkub

5

09.03 L

HPSG I (slaidid)


10.03. P

Lingo Grammar Matrix  esimest korda käivitamine ja rutiinne töökäik

6

16.03. L

HPSG II, slaidid


17.03. P

Lingo Grammar Matrix 

7

23.03. L

HPSG III

slaidid


24.03. P

Lingo Grammar Matrix 

8

30.03. L

LFG I Slaidid
Kirjandus: Fred Karlsson. Üldkeeleteadus ptk 5.3


31.03. P

Lingo Grammar Matrix

9

06.04. L

LFG II Slaidid


07.04. P

Lingo Grammar Matrix


13.04. -

Suur Neljapäev


14.04. -

Suur Reede

10

20.04. L

Kategoriaalne grammatika (Maarika Traat)


21.04. P

Lingo lõpetamine


11

27.04. L

Sõltuvusgrammatikad I (Kaarel Kaljurand)


28.04 P

sõltuvusgrammatikatest

12

04.05. L

Sõltuvusgrammatikad II (Kaarel Kaljurand)


05.05. P

sõltuvusgrammatikatest

13

11.05. L

Lõplikel automaatidel põhinevad grammatikad


12.05. P

Lingvistilise teksti vormistamisest

14

18.05. L

Statistilised mudelid


19.05. P

Sõltuvusgrammatikate 2. töö Statistilised meetodid

15

25.05. L

Statistilised mudelid


26.05. P

Statistilised meetodid



Kasulikud viited

1. loeng

Detmar Meurers. Introduction to CL I. Course material.

Survey of the State of the Art in Human Language Technology

Algorithms for Computational Linguistics. Kristina Striegnitz, Patrick Blackburn, Katrin Erk, Stephan Walter, Aljoscha Burchardt and Dimitra Tsovaltzi

2. loeng

DCG lingid: Essex, Sussex ja Wales

3. loeng

Cheryl A. Black. A step-by-step introduction to the Government and Binding theory of syntax
Gerold Schneider Introduction to GB

4. loeng & praktikum

Loeng: Adam Przepiórkowski. Slavic Linguistics Formally - HPSG
Praktikum: Ann Copestake Implemented Typed Feature Structure Grammars ptk 2. (excerpt)

5. ja 6. loeng


Syntactic Theory: A Formal Introduction, by Ivan A. Sag, Thomas Wasow and Emily M. Bender. 2003. Stanford: CSLI Publications 3. ja 4. peatükk.

7. ja 8. loeng

Mary Dalrymple Lexical Functional Grammar.Encyclopedia of Language and Linguistics. 2006. 

Kersti Börjars F-structure from c-structure. Introduction to Syntactic Theory loengu käsilehed. 2005.


13. loeng automaatidest

Jaak Vilo loengumaterjalid
Mark-Jan Nederhof. Introduction to Finite-State Techniques
E. Roche and Y. Schabes, "Deterministic Part-of-Speech Tagging with Finite-State Transducers", Computational Linguistics 21(2), 227-253, 1995
Kemal Oflazer, Dependency Parsing with an Extended Finite-state Approach, Computational Linguistics, Volume 29, No:4 2003.

14. ja 15. loeng


Eugene Charniak.
Statistical techniques for natural language parsing AI Magazine. (1997).