Peatükk 3 Kõne akustika

Kõne, nagu igasugune teinegi heli, on füüsikaliselt õhuosakeste võnkumine. Kõik asjad, mis liiguvad, panevad end ümbritsevad õhuosakesed kaasa liikuma. Ruumis kandub liikumine edasi ühtedelt õhuosakestelt teistele. Ruumis viibiva inimese kõrvades kandub liikumine õhuosakestelt üle trummikilele ning sealt edasi sisekõrva, kus see teisendatakse närviimpulssideks, mida tajutakse helina.

Inimese kõneaparaati (vt joonis 3.1 võib jagada kolmeks osaks: alumist osa kopsudest kõrini nimetatakse respiratoorseks süsteemiks, kõri, ning kõrist ülespoole jäävat osa nimetatakse kõnetraktiks. Respiratoorne süsteem ja kõri tegelevad põhiliselt heli tekitamisega, kõnetrakt tegeleb peamiselt häälikute moodustamisega.3

Kõnetrakti skeem. Kõripealse kõnetrakti aktiivsed artikulaatorid on tähistatud punasega ja passiivsed artikulaatorid sinisega, kõri ning respiratoorse süsteemi osad rohelisega.

Joonis 3.1: Kõnetrakti skeem. Kõripealse kõnetrakti aktiivsed artikulaatorid on tähistatud punasega ja passiivsed artikulaatorid sinisega, kõri ning respiratoorse süsteemi osad rohelisega.

Kõne puhul algab õhu liikumine kopsudest. Diafragma (ehk vahelihas) paneb kopsudes õhu liikuma, kopsudest tulev õhk omakorda paneb liikuma häälekurrud, mis tekitab kuuldava heli. Samuti tekitab kuuldavat heli see, kui õhk kõnetraktis hõõrdub. Enamasti toimub kõnelemine välja hingatud õhuga (seda nimetatakse egressiivseks), harvem räägitakse ka sisse hingamisel (see on ingressiivne kõne).

Kõris tekkiv heli läbib edasi kõnetrakti, milleks on neelu-, suu- ja ninaõõs, mille kaudu õhk sisse ja välja pääseb. Kui kõne heli tekitavad häälekurrud, siis ülemise kõnetrakti kuju muutmisega muudetakse heli kvaliteeti ehk moodustatakse häälikuid. Kõnetrakti osi, mis häälikute moodustamisel osalevad, nimetatakse artikulaatoriteks. Aktiivsed artikulaatorid on keel (keeleselg ja keeletipp) ja huuled ning kurgunibu, mis aktiivselt liiguvad ja ahtuseid või sulge moodustavad. Passiivsed artikulaatorid on hambad, hambasombud, kõva suulagi ja pehme suulagi, mille suunas liikudes või vastu puutudes aktiivsed artikulaatorid ahtuseid ja sulge moodustavad.

3.1 Õhuosakeste võnkumine ja seosed heliga

Kui häälekurrud tekitavad vibreerides kõneheli, siis ruumis kandub see edasi õhuosakeste liikumisega. Heli liigub ruumis lainetena, vibreeriv keha paneb enda ümber õhuosakesed edasi-tagasi liikuma ja see võnkumine kandub järgmistele ümbritsevatele õhuosakestele edasi, liikudes kiirusega 344 m/s.

Seda, kui kiiresti õhuosakeste edasi-tagasi võnkumine toimub, mõõdetakse sagedusega: kui mitu võnget toimub ühes sekundis. Sageduse mõõtühik on herts (Hz). 1 herts = 1 täisvõnge / ühe sekundi jooksul. Sagedus määrab helikõrguse: mida kõrgem heli, seda kõrgemal sagedusel toimub võnkumine.

Seda, kui suures ulatuses õhuosakesed liiguvad, mõõdetakse laine kõrgusega. Amplituud ehk laine kõrgus määrab heli tugevuse. Õhuosakeste liikumise tugevus on tajutav õhurõhu muutusena ja rõhu mõõtühik on paskal (Pa). Paskalites mõõdetuna on inimesele kuuldav vahemik kuulmislävest valuläveni umbes 20 µPa – 100 Pa. Inimtaju kirjeldamiseks sobib aga paremini paskalitest teisendatud logaritmiline detsibelli (dB) skaala. Detsibelli skaala on intervallskaala, mis teisendatakse tavaliselt kuulmisläve suhtes – st detsibelli skaalal pole absoluutset nullpunkti.

3.1.1 Sagedus

Heli kõrgust ehk sagedust arvutatakse nii:

  • Sagedus = täisvõngete arv ühes sekundis
  • Võnkeperiood (1 täisvõnkeks kuluv aeg) = 1 sekund / sagedus
  • Sagedus = 1 sekund / täisvõnkeks kulunud aeg

Näiteks kui sagedus on 100 Hz (joonis 3.24, kuula):

  • 100 Hz = 100 võnget / 1 sekund
  • 1 võnke kestus: 1 sekund / 100 Hz = 0,01 s
  • Sagedus: 1 sekund / 0,01 s = 100 Hz

Või kui sagedus on 500 Hz (joonis 3.3, kuula)::

  • 500 Hz = 500 võnget / 1 sekund
  • 1 võnke kestus: 1 sekund / 500 Hz = 0,002 s
  • Sagedus: 1 sekund / 0,002 s = 500 Hz.
Lihtheli: 100 Hz siinusheli; ühe sekundiga tehakse 100 täisvõnget, 1 täisvõnkeks kulub 0,01 sekundit.

Joonis 3.2: Lihtheli: 100 Hz siinusheli; ühe sekundiga tehakse 100 täisvõnget, 1 täisvõnkeks kulub 0,01 sekundit.

Lihtheli: 500 Hz siinusheli; ühe sekundiga tehakse 500 täisvõnget, 1 täisvõnkeks kulub 0,002 sekundit.

Joonis 3.3: Lihtheli: 500 Hz siinusheli; ühe sekundiga tehakse 500 täisvõnget, 1 täisvõnkeks kulub 0,002 sekundit.

3.1.2 Perioodilised ja korrapäratud võnkumised

Helid on kas perioodilised või mitteperioodilised. Perioodiline võnkumine on korrapärane, st järjestikused täisvõnked on sarnase pikkuse ja kõrgusega. Perioodilistel helidel tajume me kindlat kõrgust. Mitteperioodilise võnkumise lained on korrapäratu pikkuse ja kõrgusega. Mitteperioodilisi helisid tajume mürana.

Müra võib olla erineva kõlaga sõltuvalt sellest, kuidas on heli intensiivsus spektris (erinevates sagedusvahemikes; spektrist tuleb lähemalt juttu peatükis 8) jaotatud. Sellist müra, kus kogu spektri ulatuses on helienergia on jaotunud statistiliselt ühtlaselt ühesuguse amplituudiga üle kõigi sageduste, nimetatakse valgeks müraks (ingl white noise). Joonisel 3.4 on valge müra helilaine, kuula, kuidas see kõlab.

Mitteperioodiline heli, mida tajume mürana. Ükski võnge pole järgnevaga samasugune.

Joonis 3.4: Mitteperioodiline heli, mida tajume mürana. Ükski võnge pole järgnevaga samasugune.

3.1.3 Liht- ja liithelid

Helid on kas lihthelid või liithelid. Perioodilised lihthelid on tavalised sinusoidid, mille võnkumine toimub ühel kindlal sagedusel (vt jooniseid 3.2 ja 3.3). Need siinushelid on genereeritud Praatis, aga siinusheli tekitab näiteks helihark või vile.

Enamik looduses esinevatest helidest on aga liithelid, häälekurdude vibreerimisel tekkiv heli nende hulgas. Liithelid on mitmest sageduskomponendist koosnevad helid. Kõik need komponendid on üksikuna vaadeldes mingi kindla sageduse ja amplituudiga siinushelid (ehk lihthelid). Heliallika võnkumise sagedus tekitab kõige madalama sagedusega osaheli, mida nimetatakse põhitooniks, kõrgemaid komponente nimetatakse ülemhelideks. Ülemhelid on põhitoonist täisarvkordselt kõrgema sagedusega.

Näiteks kui laulda esimese oktavi la nooti, tekitavad häälekurrud selliseid osahelisid:5

  • Põhitoon f0 = 440 Hz
  • Esimene ülemheli f1 = 2 x 440 = 880 Hz
  • Teine ülemheli f2 = 3 x 440 = 1320 Hz
  • Kolmas ülemheli f3 = 4 x 440 = 1760 Hz
  • Neljas ülemheli f4 = 5 x 440 = 2200 Hz
  • jne

Joonisel 3.5 on näidatud ülemises reas 440 Hz liitheli täisarvkordsed komponendid siinushelidena (KUULA) ja alumises reas kokku liidetuna, nii et iga järgmise sammuga lisandub järgmine osaheli (KUULA).

Ülemises reas siinushelid sagedusega 1) 440, 2) 880, 3) 1320, 4) 1760, 5) 2200 Hz, alumises reas liidetuna: 1) ainult põhitoon, 2) ühe, 3) kahe, 4) kolme ja 5) nelja ülemheliga.

Joonis 3.5: Ülemises reas siinushelid sagedusega 1) 440, 2) 880, 3) 1320, 4) 1760, 5) 2200 Hz, alumises reas liidetuna: 1) ainult põhitoon, 2) ühe, 3) kahe, 4) kolme ja 5) nelja ülemheliga.

3.1.4 Sagedus ja helikõrgus

Inimene tajub helikõrgust logaritmiliselt: muutus 100 hertsilt 200 hertsile tajutakse sama suurena kui muutust 150 hertsilt 300 hertsile, mitte 150 hertsilt 250 hertsile.

Täisarvkordne sageduse vahe on muusikaliselt üks oktav. Esimese oktavi la on 440 Hz, sellest oktav üles on 2*440=880 Hz, oktav alla on 440/2=220 Hz. Inimese hääle kõrgus sõltub tema häälekurdude pikkusest ja paksusest. Inimese hääle põhitooni sagedus kõneldes on meestel umbes 60-180 Hz, naistel 150-250 Hz ja lastel 300-1500 Hz. Seega meeste ja naiste hääleulatuse vahe on (suurtes piirides) ka umbes üks oktav.

Kui kindla kõrgusega liithelide ülemhelid on täisarvkordsed6, on inimese kõrv võimeline tuvastama põhitooni ka siis, kui see tegelikult on kaduma läinud. Näiteks telefoni liin7 laseb läbi ainult sagedusvahemikku umbes 300 – 3300 Hz. Samuti paljud (odavamad) mikrofonid ning kõrvaklapid ja kõlarid ei edasta madalamaid sagedusi. Sellest hoolimata kuuleme me telefonis ka väga madalaid meeshääli. Kuna ülemhelid on põhitooni täisarvkordsed, on inimaju võimeline põhitooni ülemhelide põhjal rekonstrueerima.

Inimene kuuleb helisid vahemikus umbes 16 Hz – 20 000 Hz. Umbes 20. eluaastast kuulmise ülemine piir langeb paar hertsi aastas.

Helikõrguse mõõtmiseks on võimalik kasutada ka alternatiivset lineaarset bargi skaalat (mis ongi teisendatud hertsidest arvestades, et muutused oleksid taju jaoks lineaarsed ja 1 bargine muutus oleks tajutav). Sageli kasutatakse ka muusikalist helirida, mis jagab oktavi 12 pooltooniks (kasutatakse ka terminit semitoon). Muusikalise helirea puhul vastab esimese oktavi la 440 hertsile. Kui hertsiskaala on absoluutse nullpunktiga suhteskaala (0 Hz tähendab, et võnkumist ei ole), siis pooltooniskaala on intervallskaala, mida teisendatakse hertsidest mingi väärtuse suhtes ja see teisendusaluseks olev väärtus võib olla erinev.

3.2 Heli tugevus

Heli tugevusena mõõdetakse õhu osakeste liikumisest tekkivat rõhku, mida füüsikas mõõdetakse paskalites. Inimese helitugevuse kuulmislävi on umbes 20 mikropaskalit,8 sellest vaiksemaid helisid ei ole me võimelised helina tajuma. Heli tugevuse tajumise ülemine piir on valulävi, st piir, millest valjemad helid meile haiget teevad. Helitugevuse valulävi on 20 paskalit. Sellest valjemad helid põhjustavad kuulmiskahjustusi.

Kuna inimese kuulmine on logaritmiline (st muutus ühe ühiku võrra ei ole igas skaala piirkonnas tajutav sama suure muutusena) ning kuna vahemik 20 µPa (0,000 002 Pa) – 20 Pa on väga suur ja sellega on tülikas ümber käia, kasutatakse ka helitugevuse mõõtmiseks logaritmilist belli skaalat (tavaliselt ühikuks detsibell, dB).

Detsibelli skaala on intervallskaala, st sellel pole fikseeritud nullpunkti, sest see teisendatakse mingi helirõhu väärtuse suhtes. Kui mõõdetakse keskkonnas leviva heli mõju kuulajale, siis võetakse nullpunktiks inimese kuulmislävi (mis on umbes 20 µPa 1000 Hz juures). Kuulmislävest valuläveni on siis 120 dB. Tabelis 3.1 on esitatud mõningate heliallikate tekitatav helivaljus detsibellides.

Kui aga oled mõne salvestusseadme peal näinud helitugevuse mõõtjat, siis seal on skaala -∞ – 0. Seal on nullpunktiks kõige valjem heli, mida seade suudab ilma moonutusteta salvestada.

Tabel 3.1: Erinevate heliallikate tüüpiline helitugevus. Paksus kirjas helid, mis ületavad valuläve.
Heliallikas dB_SPL
Tõusev rakett 180
Reaktiivmootor 140
Pikselöök 1 meetri kaugusel; õhutõrje sireen 130
Lennuki õhkutõusmine (60 meetri kaugusel) 120
Rokk-kontsert 110
Ilutulestik; metroorong 100
Veoauto (15 meetri kaugusel); linnaliiklus 90
Äratuskell; föön 80
Kohvikumelu 70
Õhukonditsioneer; vestlus 60
Kerge liiklus (50 meetrit); keskmine kodu 50
Elutuba, vaikne kontor 40
Raamatukogu; vaikne sosin (5 meetri kauguselt) 30
Raadiostuudio; langevad lehed 20
Kuulmislävi 0

Kui heli kõrgus sõltub heliallika võnkesagedusest, siis valjuse ja amplituudi seos ei ole võrdeline, see sõltub ka heli kõrgusest. Kui meil on kaks ühesuguse amplituudiga heli, üks on kõrgusega 100 Hz, teine kõrgusega 1000 Hz, siis tajume viimast valjemana. See on selle pärast, et inimkuulmine on teatud sagedusvahemike suhtes kohanenud tundlikumaks – eristame paremini helisid sagedusvahemikus, kus on enim olulist informatsiooni inimkõnes.

Ka heli tugevuse kasv ei toimu lineaarselt. St kaks korda suurem amplituud ei tee heli inimese tajule kaks korda tugevamaks, vaid lisab ainult 3 dB. 10 korda tugevam heli lisab 10 dB ja see on inimtaju jaoks umbes kaks korda valjem. Seega, kui üks inimene räägib 50 dB valjusega, siis kaks inimest tekitavad korraga sama valjult rääkides 53 dB ja kümme inimest 60 dB valjusega heli. Vastasel korral, kui helitugevus kasvaks lineaarselt, siis kaks inimest suudaks teha 100 dB väga kõva lärmi, aga kolme inimese kõne 150 dB lõppeks kuulmiskahjustusega.

3.3 Heli tämber

Heli kõrguse ja tugevuse kõrval iseloomustab heli tämber. Heli tämbril ei ole otsest vastet laine füüsikaliste tunnuste hulgas, see on nende kombinatsioon ja selle muutumine ajas. St erineva kõlaga helidel on osahelide intensiivsus erinev. Inimhääle puhul osahelisid võimendab või summutab kõnetrakt: kõneorganid neelust huulteni. Igal inimesel on kõneorganite kuju pisut erinev ja sellest tulenevalt on igal inimesel iseloomulik hääletämber. Lisaks sellele kõneldes muudame kõnetrakti kuju pidevalt, mistõttu üks inimene saab erineva tämbriga häält teha. Samuti iseloomustab erinev tämber erinevaid häälikuid. Tämbrit saab uurida analüüsides hääle spektrit, millest tuleb lähemalt juttu peatükis 8.


  1. Mõnede käsitluste järgi nimetatakse ka kogu süsteemi kõnetraktiks ning eristatakse kõrialust ning kõripealset kõnetrakti. Tavalisemalt nimetatakse kõnetraktiks aga ainult kõrist ülespoole jäävat osa ehk neelu-, suu- ja ninaõõnt.↩︎

  2. Helilaine joonistel on y-teljel helirõhk, mis muutub siin arbitraarselt skaalal vahemikus -1–1 (mis on helifaili minimaalne ja maksimaalne amplituudiväärtus). Sageli tähistatakse sellise helilaine joonise y-telge pealkirjaga “Amplituud”, kuid see ei ole päris täpne, kuna amplituud tähistab võnkeperioodi kõige kõrgemat või madalamat punkti, mitte vahepealseid väärtuseid.↩︎

  3. Häälekurdude tekitatavate osahelide intensiivsus langeb -12 dB oktavi kohta, millega joonisel 3.5 pole arvestatud, seal on kõik komponendid genereeritud sama intensiivsusega.↩︎

  4. Looduses esineb ka helisid, mille ülemhelid ei ole põhitooni täisarvkordsed, nt kirikukellad. (Jaan Rossi märkus.)↩︎

  5. See käib küll tradisioonilise analoogtelefoni kohta, kaasaegses digitaalses andmesides ei ole kõnesignaali ja kanali läbilaskevõime seosed nii üksühesed ning kasutatakse erinevaid keerukaid algoritme andmemahu optimeerimiseks.↩︎

  6. 1000 Hz juures. Helitugevuse taju ei ole monotoonne, väga madalate ja kõrgete sageduste puhul on tajulävi kõrgem ja 3000-4000 Hz vahemikus madalam.↩︎