Peatükk 14 Kõnekorpuse märgendamine sõna- ja häälikutasandil
See peatükk põhineb eesti keele spontaanse kõne foneetilise korpuse (Lippus et al. 2023) märgendamisjuhendil, aga neid märgendamispõhimõtteid saab rakendada ka mistahes muu (eestikeelse) korpuse või kõneandmestiku märgendamiseks. Selle märgendamisjuhendi välja töötamisel on olnud abiks Pire Teras, kellelt pärineb osa peatükis 14.3 SAMPA transkriptsiooni näiteid. Märgendamispõhimõtete kujundamisel on eeskuju võetud BABELi korpuse kirjeldusest (Eek & Meister 1999) ja soome kõnekorpuste märgendamise juhendist (Lennes & Ahjoniemi 2005).
Peatükk koosneb kahest peamisest osast: kuidas tunda ära häälikupiire ja kuidas häälikuid märkida, kasutades SAMPA transkriptsiooni.
14.1 Märgendamiskihtide seadmine
Märgendamiskihtide määramine ei ole Praatis nii keeruline ja läbimõtlemist nõudev, kui mõnes teises programmis (nt Elan), kuid ühe projekti piires on kasulik märgenduskihid järjestada ja nimetada kindlal viisil. Kirjeldust sellest, kuidas helifaili kõrvale TextGrid objekt luua ja märgendamiskihid seada, vaata peatükist 7.
Siin peatükis eeldame, et kasutad kahte märgenduskihti: esimese kihi nimi võiks olla sõnad ja teise kihi nimi häälikud. Mõnel juhul võiks olla vajalik sõnad kihist ettepoole lisada lausungid. Kui su andmestik sisaldab rohkem kui ühte faili ja kavatsed hiljem TextGrididelt infot koguda skriptide abil, oleks kindlasti mõistlik jälgida, et sama infoga kihid oleks eri failides sama nimega.
Mugavam oleks ka see, kui kihid oleks samas järjekorras. Juba olemasoleva TextGridi kihitide järjekorra muutmine ei ole kahjuks väga mugav, selleks tuleb need õiges järjekorras eraldada käsuga Extract one tier...
ning siis jälle Merge
käsuga kokku panna.
14.1.1 Geminaatide poolitamise plugin
Foneetika korpuses jagame silbitamise eesmärgil pikad konsonandid kaheks segmendiks (vt täpsemalt selle teoreetilistest lähtekohtadest vt ptk 13.6 ja 14.3.6) ja selle hõlbustamiseks on kasutusel paarist lihtsast skriptist koosnev plugin.
Geminaatide poolitamise plugina saab laadida aadressilt https://kodu.ut.ee/~partel/praat-skriptid/plugin_geminaadiPoolitamine.zip Kopeeri see kataloog oma arvuti oma seadete kataloogis olevasse Praati seadete kausta (vt kust seda leida).
Windowsis võiks Praati seadete kataloogi asukoht olla C:\Users\Sinu_Kasutajanimi\Praat
.
Kui kasutad Maci, siis seadete kaust on tavaliselt peidetud. Kui sul ei õnnestu seda kausta üles leida, siis mine Go
> Utilities
> Terminal.app
ning kirjuta käsureale
open /users/KASUTAJA/Library/Preferences/Praat\ Prefs/
kus KASUTAJA
asemele kirjuta oma kasutajanimi arvutis, mida kasutad. Vajuta Enter. Nüüd peaks õige kataloog avanema.
Kui kataloog plugin_geminaadiPoolitamine
on õigesse kohta tõstetud, pane Praat korra kinni ja siis ava uuesti. Sellega peaks plugin olema installitud ja edaspidi on TextGrid Editori menüüs Editi käsud Q2 geminaat
ja Q3 geminaat
. Nende käskude rakendamisest tuleb juttu allpool seoses geminaatide poolitamisega.
14.2 Häälikupiirid
Segmentimisel peaks jälgima häälikutevahelisi piire nii helilaines (ostsillogrammil) kui spektrogrammil. Kui üksteisele järgnevad häälikud on moodustuskoha ja -viisi poolest kontrastsemad, on seda lihtsam teha, lähedaste häälikute puhul võivad piirid olla hägused ja nende täpsem määramine võrdlemisi kokkuleppeline.
Mõningatel juhtudel on ka kokkuleppeline see, kas mingit kõneüksust pidada üheks või mitmeks segmendiks. Näiteks eesti keele spontaanse kõne foneetilises korpuses on tavaks diftongid jagada kaheks, arvestades kahe vokaali vahelist siiret, mis jagatakse mõlema diftongi osise vahel pooleks (vt 14.2.6). Diftongikomponentide vahelise piiri leidmine on aga väga subjektiivne, tihtipeale realiseerubki diftong siirdena, kus osiste nn stabiilseid sihtmärke ei ole võimalik tuvastada. Diftongiosiste eristamine ei pruugi alati olla vajalik või teoreetiliselt põhjendatud.
Sarnane probleem on geminaatkonsonantidega. Eesti keele välte kirjeldusest lähtudes (vt ptk (valde)) on silbitamiseesmärgil traditsiooniks jagada teisevältelistes sõnades geminaat kaheks segmendiks nii et kummassegi segmenti jääb pool häälikust, ning kolmandavältelistes sõnades põhimõttel 2/3+1/3. Eesti keele spontaanse kõne foneetilise korpuse märgenduses kasutatkse jagamiseks selleks kirjutatud skriptide abi. Sõnalõpulisi pikki konsonante osadeks ei jagata (v.a juhul kui järgnev sõna algab vokaaliga, nt fraasis naljakat asja – n|A|l’|j|A|k|k|A|t:|t|A|s’:|j|A
). Ka need põhimõtted on kokkuleppelised ja ei pruugi olla alati põhjendatud või sõltuvalt uurimisküsimusest vajalikud.
Klusiili ja järgneva helilise hääliku piir pannakse sinna, kus algab järgneva hääliku helilisus. Kui klusiil jääb fraasi algusesse ja järgneb vaiksele pausile, ei ole enamasti akustiliste tunnuste alusel võimalik klusiili algust kindlaks määrata. Erinevates märgendamiskonventsioonides on siis erinevaid lähenemisstrateegiaid. Eesti keele spontaanse kõne foneetilises korpuses märgitakse akustiliste iseloomustajate puudumisel sellise klusiili kestuseks kuni 100 ms (vt 14.5).
Järgnevalt on toodud mõningaid näiteid erinevate häälikupiiride märgendamisest. Siin keskendume just piiride leidmisele, helilaine ja spektrogrammi lugemisele, mitte niivõrd häälikute klassifitseerimisele ja hääliku kvaliteedi iseloomustamisele.
14.2.1 Pausi ja vokaali piir
Pausi järel vokaaliga algava sõna alguspiir võiks olla seal, kus helilaines algab perioodiline võnkumine ja spektrogrammil algavad tugevad formandid (vt punase kursoriga märgitud piiri joonisel 14.1, kuula). Enne seda on näha paar õrna ja ebakorrapärast võnget helilaines ja natuke midagi ka spektrogrammil, mida võiks pidada preaspiratsiooniks: enne kui häälekurrud hakkavad võnkuma, tuleb natuke õhku, mis kõnetraktis hõõrdub ja tekitab pisut kahinat.

Joonis 14.1: Vokaaliga algav sõna pausi järel. Vokaali aluse piir märgitud punase kursoriga.
14.2.2 Vokaali ja helitu konsonandi piir
Vokaali ja frikatiivi /s/ vahelise piiri võiks panna sinna, kus perioodiline helilaine muutub “karvaseks” ja spektrogrammil alumised formandid hääbuvad. Vokaalide vahel muutub lühike /s/ sageli heliliseks (näiteks joonisel 14.1, kuula). Järgmises näites (joonis 14.2, kuula) järgneb vokaalile helitu /s/.

Joonis 14.2: Vokaali ja /s/ vaheline piir (märgitud punase kursoriga).
Vokaali ja klusiili vahelise piiri võiks panna sinna, kus tugev perioodiline helilaine lõppeb ja spektrogrammil hääbuvad alumised formandid. Ka helitu klusiili puhul on helilaines peale klusiili algust veel paar-kolm hääbuvat võnget, aga sellele järgneb sulg (vt esimese punase kursoriga tähistatud piiri joonis 14.3).
Klusiili ja vokaali vaheline piir peaks minema sinna, kus peale eksplosiooni (ja sellele järgnevat lühikest kahinat) algab perioodiline helilaine ning spektrogrammil algavad tugevad formandid (vt teine punase kursoriga piir joonisel 14.3, kuula).

Joonis 14.3: Vokaali ja klusiili piir. Punase kursoriga märgitud helitute klusiilide ja vokaalide vahelised piirid, sinisega heliliseks muutunud vokaalidevaheline lühike klusiil.
Näites 14.3 lõppeb üks sõna klusiiliga /t/ ja järgmine algab klusiiliga /p/. Esimese klusiili lõpus ei ole selget kuuldavat (ega nähtavat) eksplosiooni, mistõttu nende vahele piiri tõmmata on akustiliste tunnuste põhjal keeruline. Siin on jagatud segment täpselt kaheks võrdseks osaks (kasutades käsku Q2 geminaat
geminaatide poolitamise pluginast, vt 14.1.1).
Näites 14.3 on näha ka sõna said, mille lõpus klusiil on muutunud heliliseks (märgitud siniste kursoritega). Helilise klusiili ja vokaali piir on siin näha helilaine oluliselt väiksema intensiivsusega. Klusiili lõpus on spektrogrammil näha eksplosiooni õrn “kriips”. Seda, et klusiil on heliline, saame aru perioodilisest helilainest ning ka sellest, et põhitooni sinine joon ei katke. Helitu klusiili sulg (nagu sõna need pildid piiril) on vaikne, helilaine on “sirge kriips”.
14.2.3 Vokaal enne pausi
Pausile eelneva vokaali lõpp võiks olla seal, kus hääbuvad spektrogrammil ülemised formandid. Sellele võib järgneda veel paar perioodilist helilainevõnget, mis on aga pisut lihtsama struktuuriga kui vokaali omad. Kui seda kuulad, siis see kostab /h/ moodi kahinana (vt 14.4, kuula). Kui aga kõneleja paneb fraasi lõpus suu kinni, võib aspiratsioon kõlada kui /m/. Kuna see aspiratsioon esineb lausungi lõpus enne pausi ja on seotud kõnetegevuse seiskamisega, siis see pole otseselt selle vokaali omadus ja seetõttu võiks märkida eraldi segmendiks.

Joonis 14.4: Aspiratsioon pausieelse sõna lõpus.
14.2.4 Klusiil ja paus
Pausile järgnev klusiil. Kui vaiksele pausile järgneb klusiil, ei ole tihti selle algust võimalik akustiliste tunnuste põhjal määrata. Sel juhul võiks klusiili kestuseks jääda kuni 100 ms või umbes nii pikk, nagu keskmiselt see häälik sõna alguses on nende juhtude põhjal, kus seda mõõta saab. Tihti eelneb pausi järel klusiiliga algavale sõnale sissehingamine, sel juhul võiks panna piiri sissehingamise lõppu (vt joonis 14.5, kuula).

Joonis 14.5: Pausile järgnev klusiil. Segmendi alguspiir (punasega) on märgitud nii, et selle kestus oleks 100 ms.
Alternatiiv oleks märkida lausunungialgulise klusiili kestuse alguseks eksplosiooni algus, mis on akustiliselt määratletav. Sellise konventsiooni puudus on see, et eksplosiooni kestus on umbes 10-20 millisekundit ja see ei ole võrreldav teiste häälikute kestusega samas positsioonis.
Klusiilile järgnev paus. Klusiili ja sõna lõpu piiri võiks panna eksplosiooni järele. Kui klusiilile järgneb paus, siis tihti järgneb eksplosioonile aspiratsioon. Eesti keeles ei ole see aspiratsioon klusiili omadus, vaid on tingitud fraasi lõpust ja sellest, et kuigi artikulatsioonitegevus on lõppenud, hõõrdub natuke õhku kopsudest väljuvat õhku veel kõnetraktis (vt ka joonis 14.4). Eesti keele spontaanse kõne foneetilise korpuses märgitakse see aspiratsioon sõnatasandil eraldi täidetud pausi segmendiks märgeniga .h (vt joonis 14.6, kuula).

Joonis 14.6: Pausieelne klusiil ja lausungi lõppu tekkiv aspiratsioon.
14.2.5 Vokaalid ja helilised konsonandid
Vokaalide ja heliliste konsonantide piirid eristuvad helilaines väikeste helilaine kuju muutustena ja spektrogrammil formantstruktuuri muutustena. Helilistel konsonantidel on madalam intensiivsus, sest erinevalt vokaalidest on nende puhul vaba õhuvool takistatud, mistõttu helilaine amplituud on madalam ja spektrogrammil on formandid heledamad. Joonisel 14.7 kuula) on kolm vokaalidevahelist konsonanti: nasaalid /n/ (piirid märgitud sinisega) ja /m/ (rohelisega) ning poolvokaal /j/ (punasega).

Joonis 14.7: Helilised konsonandid vokaalide vahel: /m/, /n/ ja /j/.
Poolvokaalid ei eristu üldjuhul selgepiiriliselt ümbritsevatest vokaalidest ja nende piirid tuleks panna poole siirde peale (vt joonis 14.823 kuula).

Joonis 14.8: Poolvokaal /j/ vokaalide vahel.
14.2.6 Diftongid
Sarnaselt vokaalidevahelisele poolvokaalile ei ole diftongi osistel selgeid piire. Paljudes keeltes (nt inglise) loetakse diftonge vokaalfoneemideks. Kuna eesti keele süsteemis on diftongide moodustamine geneeriline ja diftonge on väga palju, võiks neid pigem pidada foneemijärjenditeks. Kui diftongi osiseid eraldi segmentideks märgendada, tuleks jagada nad siirde keskelt pooleks. Piiri võib aidata määrata ka helilaines väiksem intensiivsus kahe vokaali piiril (vt joonis 14.9 kuula).

Joonis 14.9: Piir diftongi osiste vahel.
14.2.7 Tremulant
Värihäälik /r/ peaks eesti keeles häälduma nii, et keeletipp väriseb vastu hambasompe, moodustades lühikesi suletud ja avatud perioode, mis korduvad 3–5 tsüklit sõltuvalt hääliku pikkusest. Spontaanses kõnes on /r/-i hääldus aga väga varieeruv: sulgusid tekib võib-olla ainult üks väring (vt joonis 14.10 kuula), aga enamasti mitte ühtegi – sel juhul realiseerub /r/ poolvokaalina (14.11, kuula).
Kui IPA tabelis on eraldi märgid alveolaarse tremulandi, puute- või riivehääliku või poolvokaali jaoks, siis SAMPA transkriptsioonis on mägend alati lihtsalt r
. Ainult kui moodustuskoht ei ole mitte keeletipp-hambasombud vaid kurgunibu ehk kui /r/ on uvulaarne, siis võiks kasutada SAMPA märki R
. Uvulaarne /r/ on tavaliselt idiomaatiline, st on üksikud kõnelejad, kes kasutavad alati ainult uvulaarset /r/-i ja tavalist apikaalset varianti moodustada ei oska, ning enamik kõnelejaid, kes uvulaarset varianti ei kasuta kunagi.

Joonis 14.10: Üheväringuline /r/ geminaadina (punane) ja sõnaalgulise üksikhäälikuna (sinine).

Joonis 14.11: Poolvokaalina realiseerunud /r/
14.2.8 Pausid ja täidetud pausid
Seda, kas ja kuidas tõlgendada pause ning kuidas neid märgendada, sõltub väga suurel määral uurimisküsimusest. Siinne kirjeldus lähtub jällegi eesti keele spontaanse kõne foneetilise korpuse konventsioonidest, tasub meeles pidada, et need ei ole ainuvõimalikud või -õiged.
Kui vaiksed pausid (tavaliselt foneetilises annotatsioonis märgitakse sümboliga #) on võrdlemisi selgepiirilise definitsiooniga – selle koha peal on helisignaalis vaikus24 – siis täidetud pauside puhul võib ka tekkida küsimus, kas tegemist on üldse pausiga.
Foneetikakorpuse märgenduskonventsioonis nimetatakse moodustavad täidetud pausid üldiselt kuuldav hingamine ning üneemid. Üneemid (ingl fillers) on pragmaatilise funktsiooniga kõneüksused, mida ei käsitleta leksikaalsete sõnadena, aga piir üneemide ja sõnade vahel on hägune. Näiteks joonisel 14.12 (kuula) võiks oletada, et üneemiga ee täidab kõneleja mõtlemiseks vajalikku pausi ja aitab hoida kõnevooru, mille vaikse pausi korral võiks vestluspartner kergesti üle võtta. Kuid üneemidel võib olla ka muid pragmaatilisi funktsioone, näiteks võivad nad väljendada kõneleja ebakindlust või hoopis anda vestluspartnerile tagasisidet.

Joonis 14.12: Üneem .ee, täidetud paus.
Hingamise ja vaikse pausi eristamine võib jällegi tuleneda uurimisküsimusest. Kui uurime näiteks loetud kõne korpusest mingeid kindlaid lausemalle või häälikuühendeid, ei pruugi eristamine olla vajalik. Kui aga uurime suhtlust, siis on teada, et kuuldaval hingamisel on ka vestluse modereerimise funktsioonid (Aare 2017), lisaks võib hingamine markeerida suhtumist või meeleolu.
Hingamise märgendamine helisignaalis on siiski mõnevõrra juhuslik. See, kui hästi see salvestusest on tuvastatav, sõltub väga palju mikrofoni tüübist ja paigutusest. Mida lähemal on mikrofon suule, seda paremini jääb see salvestuses kuulda, seetõttu on hingamist rohkem kuulda peamikrofoniga salvestustes. Kui mikrofon on otse suu ees, siis on salvestuses väljahingamine selgemini kuulda kui tegelikus suhtlussituatsioonis, sest mikrofon on otse membraani peale tulevale õhuvoole tundlikum.25
Kui hingamist märgendada, siis võiks segmendi algus ja lõpp märkida umbes helilaine ja spektrogrammi pildi järgi (vt nt joonis 14.13, kuula ). Enamasti piiri väga täpselt ei ole võimalik kindlaks teha ja piirid, mida me helilaines või spektrogrammil näeme, võivad palju sõltuda sellest, mis on ekraanil oleva heli üldine dünaamiline ulatus. Seda, kas tegemist on sisse- või väljahingamisega, on lihtne kuulda, raske visuaalselt otsustada. Igal juhul peaks hingamine spektrogrammil sarnanema helitutele frikatiividele, st on müra ja üldiselt peaks see olema helitu.

Joonis 14.13: Sissehingamine.
14.2.9 Häälelaad
14.2.9.1 Kärisev hääl
Kärin on mittemodaalne häälelaad. Häälekurrud vibreerivad ebakorrapäraselt ja madala sagedusega. Kuna nad siiski vibreerivad, iseloomustab kärin muidu helilisi häälikuid. Kärina puhul on nii meestel kui naistel põhitoon umbes 40–80 Hz ja võnked on ebakorrapärased, nii et põhitoonianalüüs on katkendlik. Oluline on tähele panna, et termin kärin foneetikas tähistab kitsalt häälekurdude töö eripära, mitte igasugust ragisevat või krõbisevat heli, mida võib põhjustada näiteks sügamine või kratsimine (mis tuleks märkida taustamüraks).
Üldiselt kärisevaks muutub hääl pigem sõna- ja lausungilõppudes, rõhutute silpide peal, aga ka terved lausungid võivad olla läbivalt käriseva häälega. Siin on kaks näidet: joonisel 14.14 meeskõnelejalt (kuula) ja joonisel 14.15 naiskõnelejalt (kuula).

Joonis 14.14: Kärisev hääl lausungi lõpus meeskõnelejal.

Joonis 14.15: Kärisev hääl fraasi keskel, millele järgneb modaalne hääl, naiskõneleja kõnes.
14.2.9.2 Kähisev hääl
Kähisev hääl on samuti mittemodaalne häälelaad, mille puhul häälekurrud ei sulgu korralikult ja perioodilist võnkumist saadab õhu hõõrdumine kõnetraktis, mistõttu helilaine on “karvane”. See kõlab veidi nagu “ärasuitsetatud” hääl. Kähin võib kaasneda näiteks naerdes rääkimisega. Nagu kärinagi puhul, täihistab termin kähisev hääl või kähin häälelaadi muutust, kirjeldades häälekurdude tööd, mitte mistahes kahinat, mida võib põhjustada õhu liikumine või riiete sahisemine liigutamisel vms.
Järgnevalt kolm näidet kähisevast häälest: joonis 14.16 kõneleb vanem meesterahvas (kuula), läbivalt kähisev tagasisideüksus 14.17 (kuula) ning veel üks näide, kus kähisev on esimene sõna “idaring” ja edasi läheb modaalse häälelaadiga: joonis 14.19 (kuula).

Joonis 14.16: Kähisev hääl.

Joonis 14.17: Kähisev hääl.
Kui eelmises näites 14.17 vokaali sisse suumida (vt joonis 14.18), siis näeb, et üldkujult perioodiline laine on “karvane”, st seal on palju ebakorrapäraseid pisivõnkeid, mida põhjustab õhu hõõrdumise müra.

Joonis 14.18: Helilaine kähiseva häälega.

Joonis 14.19: Kähisev hääl.
14.3 Eesti SAMPA transkriptsioon
Kõnekorpuste märgendamisel on küllalti tavaline kasutada SAMPA (Speech Assessment Methods Phonetic Alphabet) transkriptsiooni (millel on ka eesti keele kirjeldus). SAMPA on rahvusvahelise foneetilise tähestiku IPA lihtsustatud variant, mis kasutab ainult ASCII sümboleid.
14.3.1 SAMPA sümbolid
Huuled | Huul-hammas | Hambasombud | Kõva suulagi | Pehme suulagi | Kurgunibu | Kõri | |
---|---|---|---|---|---|---|---|
Klusiil | p | t | k | ? | |||
Nasaal | m | n | N | ||||
Tremuilant | r | R | |||||
Frikatiiv | f v | s S | h | ||||
Poolvokaal | w | j | |||||
Lateraal | l |
Ees | Redutseeritud | Taga | |||
---|---|---|---|---|---|
ümardamata | ümardatud | ümardamata | ümardatud | ||
Kõrge | i | y | u | ||
Keskkõrge | e | 2 | @ | 7 | o |
Madal | { | A |
Häälelaad | Vokaali häälduskoht | Konsonandid |
---|---|---|
0 helitu n_0 A_0 | + eespoolne A_+ | ’ palataliseeritud t’ l’ |
v heliline s_v t_v | - tagapoolne e_- | = silbiline s_= l_= |
k kärisev m_k A_k | r kõrgenenud e_r | |
t kähisev m_t A_t | o madaldunud e_o | |
~ nasaleeritud o_~ |
14.3.2 Häälikute põhimärgid
Vokaalid (sulgudes häälikut tähistav kirjatäht)
A
(a), e
, i
, o
, u
, 7
(õ), {
(ä), 2
(ö), y
(ü), @
(švaa, tugevalt redutseeritud vokaal)
Konsonandid
p
, t
, k
, s
, S
(š ja ž), Z
(ž, kui on heliline), f
, v
, h
, m
, n
, N
(velaarne /n/ ng- ja nk-ühendis), l
, r
, R
(uvulaarne /r/ allofoon), j
, w
, ?
(kõrisulghäälik).
Poolvokaalid (mida ortograafias ei märgita): j
, w
(nt siijA
, sii:jA
, lyi:jA
, luuwA
, luu:wA
, lAuwA
)
14.3.3 Pikkus ja välted
Fonoloogilist pikkust märgitakse rõhulistes (ja kaasrõhulistes) silpides.
Eesti keele spontaanse kõne foneetilise korpuse märgendamisel lähtutakse pikkuse märkimisel järgmistest reeglitest, mis omakorda lähtuvad BABELi korpuse märgenduspõhimõtetest (Eek & Meister 1999).
- lühikest vokaali tähistab ühekordne vokaali või konsonandi märk (nt
sAtA
). - pikka vokaal kahekordne vokaali põhimärk (nt
sAAta
) - ülipikka kahekordne põhimärk ja pikendusmärk (nt
sAA:ta
). - konsonantide puhul samuti lühike ühekordse märgiga
- pikk konsonant ühe märgi ja pikendusmärgiga (nt
kel:
) - kui pikk konsonant on vokaalide vahel, siis jaguneb kaheks segmendiks, nii et uut silpi alustab lühike konsonant, (nt Q2
kellA
, Q3kel:lA
). Sellest natuke selgemini ehk näidete varal allpool.
Sellise märgenduse põhjenduseks on see, et vokaalide puhul pikad monoftongid oleks märgitud sarnaselt diftongidega ning vokaalidevaheliste pikade konsonantide puhul oleks võimalik tähistada silbipiiri. Alternatiivselt võiks tähistada lühikest häälikut ühekordse vokaali või konsonandi märgiga, pikale lisada ühe pikendusmärgi ja ülipikale kaks pikendusmärki.
Rõhutud silbid on alati fonoloogiliselt lühikesed, seega rõhutu silbi vokaal alati ühe põhimärgi ja ilma koolonita. Soome-ugri foneetilise transkriptsiooni tradisioonis (Ariste 1978) on kombeks märkida ka rõhutu silbi vokaali esmavältelistes sõnades poolpikaks ja kolmandas vältes vaeglühikeseks ning seda on näiteks järgitud ka eesti fonoloogia kirjelduse IPA näidetes (nt Asu et al. (2016) ja Metslang et al. (2023) küll ainult poolpikkust).
Sõltumata fonoloogilisest pikkusest võivad kõik segmendid olla venitatud. Venitust märgitakse eesti keele spontaanse kõne foneetilises korpuses kahe pikendusmärgiga, nt mida mit_vA::
, m::i::t_vA
. Pikendusmärke võib ühel häälikul olla maksimaalselt kaks, st kui venitatud on kolmandavältelise sõna rõhulist silpi, siis läheb info kolmandavältelisuse kohta kaotsi, nt sAA::tA
. Seepärast oleks parem, kui fonoloogiline pikkus ja venitus oleks märgitud erinevate märgenditega.
14.3.4 Monoftongid
Järgnevates näidetes tähistab |
häälikusegmendi piiri.
- Lühikesed monoftongid ühe märgiga.
- Pikad topeltmärgiga, aga üheks segmendiks.
- Kolmandavältelises sõnas (n-ö ülipikk vokaal) saab lisaks pikendusmärgi, kui silp on lahtine (kui järgnev konsonant on lühike).
- Kui kolmandavältelises sõnas pikale vokaalile järgneb konsonantühend või geminaatkonsonant, siis läheb pikendusmärk konsonandile.
Q1 | Q2 | Q3 | |||
---|---|---|---|---|---|
kalu | |k|A|l|u| | kaalu | |k|AA|l|u| | kaalu | |k|AA:|l|u| |
sada | |s|A|t|A| | saada | |s|AA|t|A| | saada | |s|AA:|t|A| |
kaardi | |k|AA|r|t|i| | kaardu | |k|AA:|r|t|u| | ||
(te) saate | |s|AA|t|t|e| | saate | |s|AA|t:|t|e| | ||
koot | |k|oo|t’:| | ||||
eest | |ee|s:|t| |
14.3.5 Diftongid
Diftongi osised märgitakse eraldi segmentideks, piir läheb siirde keskele (vt joonis 14.9).
Diftong on eesti keeles nagu pikk vokaal: diftong saab olla teises või kolmandas vältes, aga mitte esimeses. Kui sõnas peaks olema diftong, aga vokaalne segment on väga lühike (<50 ms), siis on võimalik, et see on lühikeseks vokaaliks redutseerunud.
Q2 | Q3 | ||
---|---|---|---|
kaela | |k|A|e|l|A| | kaela | |k|A|e:|l|A| |
lauda | |l|A|u|t|A| | lauda | |l|A|u:|t|A| |
süidi | |s|y|i|t|i| | süiti | |s|y|i|t:|t|i| |
auto | |A|u|t|t|o| | laud | |l|A|u:|t| |
laut | |l|A|u|t:| | ||
soust | |s|o|u|s’:|t| |
14.3.6 Pikad konsonandid ehk geminaadid
Eesti keele fonoloogilises struktuuris algavad silbid üldiselt ühe lühikese konsonandiga. Kui kahe vokaali vahele jääb pikk konsonant, siis jaguneb see kahe silbi vahel. Kuna selle konsonandi seest jookseb läbi silbipiir, tuleb geminaadid jagada kaheks ja märkida omaette segmentideiks. Kuna akustiliste tunnuste alusel pole piiri alati võimalik leida, on kokku lepitud, et teises vältes jagatakse geminaat pooleks, kolmandas vältes nii, et esimene osa oleks 2/3 ja teine osa 1/3 (Praatis kasutatakse jagamiseks skripti, vt ptk 14.1.1).
Kolmandavälteliste sõnade pikad konsonandid märgitakse ühe konsonandimärgi ja pikkusemärgiga (samamoodi tähistatakse ka pikad konsonandid sõna lõpus).
Q2 | Q3 | ||
---|---|---|---|
konna | |k|o|n|n|A| | konna | |k|o|n:|n|A| |
könni | |k|2|n’|n’|i| | könni | |k|2|n’:|n’|i| |
katu | |k|A|t|t|u| | kattu | |k|A|t:|t|u| |
šefi | |S|e|f|f|i| | šeffi | |S|e|f:|f|i| |
tuši | |t|u|S|S|i| | tušši | |t|u|S:|S|i| |
peret (rõhutu silp) | |p|e|r|e|t:| | tugevat (kaasrõhk) | |t|u|k|e|v|A|t:| |
paat | |p|AA|t’:| | ||
patt | |p|A|t:| | ||
õpetlik (kaasrõhk) | |7|p|p|e|t|l|i|k:| | ||
varss | |v|A|r|s:| |
Kui pika konsonandiga lõppevale sõnale järgneb vokaaliga algav sõna, jagatakse konsonant pooleks, nt aastat on |AA|s:|t|A|t|t|o|n:|
. Kui konsonandiga lõppeb rõhuline silp, siis 2/3-1/3, nt pütt on |p|y|t’:|t|o|n|
. Kuigi see konsonant jaguneb kahe silbi vahel, peaks sõnatasandil jääma vokaaliga algava sõna algus vokaaliga kohakuti.
Kõigil muudel juhtudel, kui on pikk konsonant, aga ei ole silbipiiri (konsonantühendis või sõna lõpus ja ei järgne vokaaliga algavat sõna), märgitakse pikk konsonant ühe häälikumärgi ja pikendusmärgiga üheks segmendiks, nt |s|ii|t:|#|
. Kui konsonantühendis on pikk konsonant, siis üldiselt ei ole see viimane komponent ja jagada pole tarvis, sest pikk konsonant jääb ühte silpi ja uue silbi algusesse jääb üks lühike konsonant.26
Q2 | Q3 | ||
---|---|---|---|
õrna | |7|r|n|A| | õrna | |7|r:|n|A| |
kongi | |k|o|N|k|i| | kongi | |k|o|N:|k|i| |
karda | |k|A|r|t|A| | karda | |k|A|r:|t|A| |
narta | |n|A|r|t|t|A| | karta | |k|A|r|t:|t|A| |
rütmi | |r|y|t|m|i| | rütmi | |r|y|t:|m|i| |
põdra | |p|7|t|r|A| | põtra | |p|7|t:|t|r|A| |
fakti | |f|A|k|t|i| | fakti | |f|A|k:|t|i| |
metsa | |m|e|t|s|A| | metsa | |m|e|t:|s|A| |
kõrtsi | |k|7|r|t|s|i| | kõrtsi | |k|7|r|t:|s|i| |
arsti | |A|r|s|t|i| | arsti | |A|r|s:|t|i| |
pang | |pA|N:|k| | ||
pank | |p|A|N|k:| | ||
palk | |p|A|l|k:| – |p|A|l’|k:| | ||
rütm | |r|y|t:|m| | ||
soodsa | |s|oo:|t|s|A| – |s|oo|t:|s|A| | ||
andsin | |A|n’:|t|s|i|n| – |A|n’|t:|s|i|n| | ||
jalgsi | |j|A|l:|k|s|i| – |j|A|l|k:|s|i| |
14.3.7 SAMPA lisamärgid
Palatalisatsioon ('
). Palataliseeruda saavad ainult konsonandid, vokaalidele seda märki lisada ei saa.
Eesti keeles palataliseeruvad alveolaarsed konsonandid /t, s, n, l/, enamasti siis kui järgneb /i/ või /j/, ja see tähendab artikulatoorselt seda, et konsonandi hääldamise ajal keeleselg liigub rohkem kõva suulae poole kui muidu selle sama konsonandi hääldamisel. Palatalisatsioonimärk tuleks lisada kõigile palataliseeritud konsonantidel ja poolitatud pika konsonandi mõlemale osale. Näiteks: pAl'i
, pAl'l'i
, lun'in
, kAn':n'e
, pAt'i
, vAt':t'i
, k{s'i
, kAs':t'i
Nasalisatsioon (_~
). Eesti keeles nasaalseid vokaalfoneeme ei ole, kuid nasalisatsiooni võib esineda koartikulatoorselt. Seda peaks märkima siis, kui redutseerumise tõttu nasaali ei hääldata ja eelnev/järgnev vokaal on tuntavalt nasaleeritud. Näiteks: o_~
(on).
Häälelaadi tähistavad lisamärgid:
- Helilistumine ehk heliliseks muutumine (
_v
). Seda peaks märkima ainult helitute konsonantide puhul (k
,p
,t
,h
,s
,S
), kui neid hääldatakse (heliliste häälikute kontekstis) helilisena. Pane tähele, et helilisus tähendab siis häälelaadi st et hääldamise ajal häälekurrud vibreerivad ja helilaine on perioodiline. See ei tähenda seda, et helitu klusiili sulu- või avanemisfaasis on kuulda mingit heli, mis on tekkinud aspiratsioonist vms. Samuti ei peaks seda märkima muidu loomult helilistele häälikutele. NtAh_vi
(ahi),Arent_vAt_vA
(arendada),sAt_vA
(sada),vik_vA
(viga),is_vA
(isa). - Helitustumine ehk helituks muutumine (
_0
). Seda peaks märkima ainult heliliste konsonantide ja vokaalide puhul, kui nad on helitu konteksti tõttu helituks muutunud, on hääldatud sosinal. See on samuti häälelaadi märk, st et häälekurrud ei vibreeri ja heli tekitab õhuvoo hõõrdumine kõnetraktis, see pole perioodiline. Seda ei peaks märkima helitute konsonantide puhul, mis oma loomult vaikimisi ongi helitud (klusiilid, s). Ntleh:m_0
(lehm, kui jääb heliliseks, on /m/ silbiline:leh:m_=
),lat:v_0
(latv),k7h:n_0
(kõhn),k7hr_0
(kõhr),vAstAttA_0
(vastata). - Kärisev häälik (vokaal/konsonant_k). Käriseda võivad kõik helilised häälikud. Kärin on häälelaad, kus häälekurrud ei vibreeri normaalselt vaid ebakorrapäraselt ja madalamal sagedusel. Nii mees- kui naishääle puhul jääb käriseva hääle sagedus 20-70 Hz, kuid kuna võnkumine on ebakorrapärane, siis ei pruugi põhitoonianalüüs üldse helilisust leida. Siiski oluline on kärina puhul ebakorrapärane sagedus, madal meeshääl võib ka modaalselt jääda alla 70 Hz. Samuti esineb kärinat, mis on kõrgema modaalse põhitooni sageduses aga ebakorrapärane.
- Kähisev häälik (vokaal/konsonant_t). Kähiseda võivad samuti kõik helilised häälikud. Kähin on häälelaad, kus häälekurrud vibreerivad tavalisel sagedusel korrapäraselt, aga ei sulgu täielikult, mistõttu pääseb läbi rohkem õhku ja see hõõrdub kõnetraktis, andes häälele n-ö “suitsuse” tämbri.
Lisamärgid _t
(kähisev) ja _k
(kärisev), _0
(helitu) ja _v
heliline on üksteist välistavad, hääl ei saa korraga olla modaalselt heliline ja käriseda või olla helitu.
Ainult vokaalide moodustuskohta iseloomustavad lisamärgid, mis tähistavad moodustuskoha, st keele positsiooni muutumist. Pane tähele, et kõrgenemine ja madaldumine tähistavad vaid vokaali moodustuskohta, mitte intonatsiooni, hääle kõrguse, põhitooni muutust. Need märgid käivad ainult vokaalidele.
- Tagavokaali eespoolsemaks muutumine (vokaal_+)
ju_+s:t
(just, /u/ hääldub /ü/-poolsena),jA_+nu
(janu, /a/ hääldub /ä/-poolsena),As’:su_+
(asju, /u/ hääldub /ü/-poolsena). - Eesvokaali tagapoolsemaks muutumine (vokaal_-)
kirikkutte_-st
(kirikutest, /e/ hääldub /õ/-poolsena),v{_-kA
(väga, /ä/ hääldub /a/-poolsena) - Vokaali kõrgenemine (vokaal_r).
ko_re:r
(koer, /o/ hääldub /u/-poolsena),pe_rA
(pea, /e/ hääldub /i/-poolsena), nii märgime ka /j/-i madalate ja keskkõrgete vokaalide vahel, kui see on hääldatud e-poolselt, ntAe_rA
(aja),oe_rA
(oja). - Vokaali madaldumine (vokaal_o).
suve_ol
(suvel, /e/ hääldub /ä/-poolsena, kui /e/ hääldub täiesti /ä/-na, võib märkida kav{h_v{
(vähe, /h/ heliliseks muutunud)),Au_otto
(auto, /u/ hääldub /o/-poolsena).
Silbiline konsonant silbituumana (_=
). Kui üldjuhul moodustab silbi tuuma vokaal, siis erandjuhtudel võib silbituumaks saada ka konsonant. Sel juhul tuleks konsonant märkida silbiliseks. Teoreetiliselt võib seda juhtuda näiteks siis, kui sõna lõpus helitule konsonandile järgneb heliline konsonant, mis ei muutu helituks, nt lehm leh:m_=
, mahl mAh:l_=
. Sagedamini tuleb seda aga ette siis, kui vokaal on redutseerunud, aga sõna silbistruktuur on säilinud, nt seda s_=tA
, mingi m_=ki
.
14.3.8 Märkide järjekord
Esimesel kohal on hääliku põhikvaliteedi märk (pika vokaali puhul topelt), sellele järgneb palatalisatsioonimärk [’] (ainult konsonantidel), siis üks või mitu lisakvaliteedimärki, kõige lõpus pikendusmärk. Lisakvaliteedimärkide järjekord on [+ -] [r o] [~] [v 0 k t] [=] (kõigepealt vokaali kvaliteedi muutumist kirjeldavad märgid, seejärel häälekvaliteeti kirjeldavad märgid; nurksulgudes üksteist välistavad märgid). Näiteks kui vokaal on eespoolsemaks muutunud ja käriseb ning on ühtlasi venitatud, siis märgime A_+_k::
või kui palataliseeritud konsonant on helilistunud ning silbiline, siis t'_v_=
.
Lisamärkidega ei maksa liialdada: kui nt A on kõvasti kõrgenenud ja eespoolsemaks muutunud ja käriseb ka, siis oleks parem märkida @_k
(kärisev redutseerunud vokaal), mitte A_r_+_k
.
14.3.9 Koartikulatsioon
Kui eelmine sõna lõppeb pika konsonandiga ja järgmine sõna algab vokaaliga, siis võiks pika konsonandi poolitada kaheks segmendiks, nii et silbitamisel saaks panna silbipiiri konsonandi keskele ja sõnaalgulist silpi alustaks lühike konsonant, nt et oli et|toli
. Samuti võib kahe sõna piiril lühike konsonant gemineeruda, nt õuna+puu 7unAp|puu:
.
Kui eelnev sõna lõppeb vokaaliga ja järgmine sõna algab samuti vokaaliga, siis võib nende piirile tekkida siirdehäälik (nt j või w). Nt ei ole ei|jole
~ e|jole
.
Kui kahe sõna piiril on samasugused vokaalid, siis võib jagada vokaali akustiliste parameetrite puudumisel pooleks (seda võib teha geminaadi poolitamise skriptiga). Seda võib teha siis, kui vokaalne segment on piisavalt pikk et seda võiks pidada kaheks vokaaliks, sest on ka võimalik, et kaks järjestikust vokaali redutseeruvad üheks lühikeseks vokaaliks.
Kui fraasi viimase sõna lõpus enne pausi on aspiratsioon, siis märgime selle .h
märgiga sõnatasandile. See kõlab kas lühikese tugeva väljahingamisena või /h/-na, mis võib olla ka heliline (isegi kui eelnev häälik kärises). Nt |siit|.h|#|
, |midA|.h|
. Aspiratsioon võib heliliste häälikute järel olla ka kinnise suuga ja nasaalne (.m
) või larüngaalne (.q
). Häälikutasandile seda pausieelset aspiratsiooni ei märgi. Kui sõnale järgneb fraasi lõpus pikem väljahingamine, siis märgime väljahingamisena (.välja
).
Venitused märgitakse kahekordse kooloniga vastava hääliku lõpus (nt sõna lõpus seda sedA::
või sõna alguses mina m::inA
). Venituseks tuleks märkida selgelt venitatud hääldus, mitte lihtsalt igasugune pikem häälikukestus. Pane tähele, et esmavältelise sõna teine vokaal ongi eesti vältesüsteemi eripära tõttu pikema kestusega kui rõhuline silp (vt ptk 13.6), seda ära märgi pikaks (ühe kooloniga) ning venitatuks märgi see ainult siis, kui sa kuuled seda venitusena.
Kirjandus
Siin näites on sõna hakka hääldatud teisevältelisena ja seetõttu on geminaat jagatud pooleks. Kui geminaadiga sõna oleks hääldatud ootuspäraselt kolmandavältelisena, tuleks geminaat jagada käsuga “Q3 geminaat” ja esimene osa märkida k:, teine osa k.↩︎
Või vähemalt ei ole seal kõneleja kõnetegevusest tekitatud heli, sest helisignaalis võib olla näiteks mööduva auto tekitatud müra, lauanõude kõlin vms heli.↩︎
Selle pärast on ka õues tuulise ilmaga salvestuses tuule mühin palju tugevam kui see, mida me ise selles situatsioonis kuuleme.↩︎
Välja arvatud erandjuhul, kui klusiil helilise konsonandi järel, siis on pikk konsonant silbipiiril ka konsonantühendis, nt panka
|p|A|N|k:|k|A|
, kurta|k|u|r|t:|t|a|
.↩︎