Peatükk 5 Katse disain ja heli salvestamine

See, millist tarkvara ja riistvara salvestamiseks kasutada, sõltub suuresti sellest, mida ja mis eesmärgil salvestada ehk katse disainist. Katse disain sõltub omakorda uurimisküsimusest.

5.1 Eetika ja andmehaldus

Foneetikat uurides uurime paratamatult päris inimesi ja seega töötleme nende isikuandmeid. Isegi kui palume katseisikul lugeda ette üksikuid sõnu või etteantud lauseid, on salvestiste näol tegemist isikuandmetega, sest kõneleja hääl võimaldab isikut tuvastada. Kui uurime spontaanset kõnet, siis võib esile tulla ka delikaatseid andmeid vestluse sisus. Seetõttu tuleb enne katset isikandmete töötlemise aspektid läbi mõelda.

Ilma isiku nõusolekuta ei tohi tema andmeid koguda. Lugemiskatse puhul, eriti kui see toimub foneetika laboris või kuskil ülikooli ruumis, kuhu katses osalejad spetsiaalselt kohale tulevad, on ilmselt osalejad salvestamisest teadlikud ja sellega nõus, aga seda peaks ikkagi üle küsima. Kindlasti peab eraldi nõusolekut küsima välitöödel ja spontaanset suhtlust salvestades.

Eesti isikuandmete kaitset puudutav seadusandlus lähtub Euroopa Liidu üldmäärusest (GDPR). GDPR-i kohaselt peab isik aru saama, mida ja miks tema andmega tehakse, et andmete töötlemiseks antud nõusolekut võiks lugeda kehtivaks. Katses osalejatele on soovitatav valmistada ette kirjalik informeeritud nõusoleku leht, kus on kirjeldatud:

  • mis andmeid kogud (nt salvestad loedud kõne heli, küsid taustaandmeid nagu sugu, vanus, haridus jms)
  • kus andmeid hoiad (nt oma arvutis või ülikooli serveris)
  • kes ligi pääsevad (sina ja juhendaja või töörühm)
  • kuidas andmeid töötled (nt mõõdad häälikute kestuseid, põhitooni, formante)
  • mida ja mis viisil avaldad
  • mida peale katse lõppu andmetega teed (kas andmeid säilitatakse, jagatakse teiste uurijatega või hävitatakse)

Sõltuvalt katse olemusest võib olla ka vajalik uuring kooskõlastada oma uurimisasutuse inimuuringute eetikakomitees. Kindlasti tuleb eetikakomitee kooskõlastust taodelda juhul, kui uurid alaealisi või haavatavatesse sihtrühmadesse kuuluvaid isikuid, või kui katse võib olla invasiivne (nt artikulatoorsete meetodite kaustamisel) või mingil muul viisil ohtlik.

5.2 Katse disain

5.2.1 Spontaanse vestluse salvestamine

Kõige loomulikum on kõne spontaanses suhtluses kõnelejate tavakeskkonnas, kuid seda võib olla küllaltki keeruline foneetilise uurimise tarvis salvestada. Loomulikus suhtluses kõnelejad liiguvad ruumis ringi ja on palju taustahelisid, mis segavad (õues tuul ja liiklus, toas televiisor või raadio, lauanõud, kodumasinad, kraan jne).

Kui eesmärk on salvestada spontaanset suhtlust spontaanses kõnesituatsioonis foneetilise uurimise eesmärgil, siis oleks hea, kui igal kõnelejal oleks oma peamikrofon. See tagab, et kõneleja ei liigu mikrofonist eemale ja peamikrofon on ka kõige vähem tundlik taustamürale, kuna on hästi suu lähedal.

Kui uurimisküsimus ei nõua just suhtlust päris spontaanses situatsioonis, võiks ruumist eemaldada kõik muud heliallikad (panna kinni muusika, televiisor jms, viia teise tuppa tiksuv kell, saata salvestuses mitte osalevad inimesed teise tuppa ja panna uksed-aknad kinni) ning paluda vestlejatel istuda ruumis kindlatel kohtadel. Võimaluse korral võiks salvestuse läbi viia salvestusstuudios või laboris, kus on müra- ja kajavaba ruum.

Kui kõnelejaid on rohkem kui kaks, siis see seab muidugi kõrgemaid nõudmisi salvestusseadmele, millel peaks siis olema rohkem mikrofonisisendeid ning kui salvestada otse arvutisse, tuleks kasutada mitmekanalilist (multitrack) tarkvara (vt peatükki 5.4.4).

Spontaanse kõne uurimise puhul võib probleemiks osutuda see, et nähtus, mida soovime uurida, ei pruugi igas vestluses üldse esile tulla või esineb väga varieeruvas kontekstis. Üks võimalus spontaanse kõne uurimiseks oleks kasutada suuremaid olemasolevaid korpuseid, kus on rohkem materjali ja suurem tõenäosus uuritavat nähtust leida. Spontaanse eesti keele foneetiliseks uurimiseks sobib hästi näiteks Tartu Ülikooli eesti keele spontaanse kõne foneetiline korpus (Lippus et al. 2023).

5.2.2 Spontaanne vestlus esilekutsumisülesandega

Selleks, et uuritav keelenähtus teatava regulaarsusega spontaanses kõnes esineks, võib üritada katsesituatsiooni manipuleerida nii, et õnnestuks uuritavat esile kutsuda. Esilekutsumiseks (ingl elicitation) kasutatakse sageli näiteks kaardiülesannet (map task), kus üks vestleja peab kirjeldama teisele teekonda kaardil, või pildiülesanded, kus vestlejad peavad leidma piltidelt erinevusi. Piltidele või kaartidele saab panna objekte, mille nimetamiseks osalejad tõenäoliselt kasutaksid sõna, väljendit või fraasi, mis sisaldab meid huvitavat foneetilist nähtust.

5.2.3 Lugemiskatsed

Sõltuvalt uurimisküsimusest võib olla vajalik rohkem kontrollida uuritava nähtuse esinemiskonteksti või esinemiste arvu.

Et uuritav tunnus esineks kontrollitud kontekstis, kasutatakse sageli raamlauset (carrier sentence). Raamlause võib korduda täpselt samal kujul kõikide testsõnadega (nt Ütle X, mitte Y., Say X again.), aga võib ka moodustada tähendusega laused, kus raamis on kontrollitud sõnade ja silpide arv enne ja pärast testsõna.

Katset disainides raamlauseid moodustades peaks läbi mõtlema, mis rõhu- ja lausepositsioonis testsõna peaks esinema. Kõige neutraalsem on paigutada testsõna fraasi keskele, aga nii et see võiks saada lauserõhu.

Sõltuvalt katse iseloomust ja uuritavast nähtusest võib katse tulemust segada see, kui katseisik uurimisküsimusest liiga palju teab või katse käigus sellest aru saab – ta võib hakata seda teadlikult rõhutama. Üks viis ära hoida, et katseisik liiga selgelt aru saaks, mida uuritakse ja see teadmine tema hääldust mõjutada võiks, on kasutada täitestiimuleid (ingl fillers). Täitelaused peaks olema vähemalt sama palju kui testlauseid. Samuti peaks stiimuleid esitama juhuslikus järjekorras.

5.2.4 Esilekutsumiskatsed

Kõiki uuritavaid tunnuseid ei ole alati võimalik kirjaliku tekstina ette anda või soovime me neid teadvustamata esile kutsuda. Selliseid olukordi võib esile tulla näiteks kui

  • uuritav tunnus on varieeruv murdeti (nt eesti keeles palatalisatsiooni kasutamine mingites sõnades);
  • uurime laste keelt selles vanuses, kui nad ei oska veel lugeda;
  • ei taha, et sõna kirjapilt mõjutaks hääldust;
  • uurime teise keele õppijaid ja tahame olla kindlad, et sõna on neile tuttav;
  • uuritav nähtus on pragmaatiline nüanss, nt iroonia, üllatus või emotsioon.

Sellistel juhutudel saab kasutada esilekutsumist katse situatsioonis: näiteks peab katseisik vastama katse läbiviijale või eelsalvestatud fraasidele või kirjeldama pilte. 2000. aastate alguses oli väga populaarne esilekutsumiskatse disain kaardiülesanne (map task), kus osalejad pidid kirjeldama teekonda kaardil. Ozi võluri (Wizard-of-Oz) katseks nimetatakse katsedisaini, kus osalejale öeldakse, et ta suhtleb arvutiga ja peab mingit ülesannet lahendama, aga tegelikult kontrollib katse käiku ja suhtleb katseisikuga eksperimendi läbiviija.

5.3 Praktilisi näpunäiteid salvestamiseks

  • Kui võimalik, kasuta stuudiot või helisalvestuskabiini. Stuudios ei ole taustamüra ja kaja, mis hiljem kõne analüüsi võiksid segama hakata.
  • Kui stuudiot ei ole, vali salvestamiseks vaikne ruum, kus on võimalikult vähe kaja (kaja vastu aitavad raamaturiiulid, vaibad, pehme mööbel).
  • Lülita välja või vii teise tuppa kõik müraallikad: arvuti, televiisor, raadio, ventilaator, tiksuv kell.
  • Võimaluse korral kasuta seadmevälist mikrofoni. Kui võimalik, ära kasuta salvestamiseks telefoni või sülearvuti sisseehitatud mikrofoni. Telefonid on nutitelefonide ajastul päris kõvasti arenenud, aga eraldi mikrofon on siiski parema kvaliteediga. Arvuti sisseehitatud mikrofon on lisaks ka arvuti ventilaatori lähedal ja salvestab palju selle müra.
  • Salvesta failid pakkimata formaadis (nt WAV). Varasemad telefonid salvestasid tugevasti pakitud 8-bitises ARM formaadis, mille kvaliteet oli väga halb. Tänapäeval peaks saama nutitelefonis ka salvestusseadeid muuta ja salvestamiseks 16 biti/44.1 kHz WAV formaadi valida.
  • Kui on võimalik salvestamise seadeid muuta, eelista bititihedust 16 bitti ja 44,1 kHz kvantimissagedust. Siis on kindel, et failiformaat ühildub sinu arvuti helikaardi jms-ga. Ära kasuta seadet, mille bititihedus on 8 bitti või maksimaalne kvantimissagedus vähem kui 10 kHz.
  • Jälgi helisalvestusnivood, et signaal ei klipiks. Tihti on salvestusseadmel võimalik reguleerida sissetuleva heli signaali tugevust ja tihti on seadmel ka näidik, mis näitab seda skaalal (-∞ – 0) või vähemalt tuluke, mis läheb põlema, kui mikrofon on seatud liiga tundlikuks (tihti tähistatud sõnaga clip). Kui salvestusnivood on võimalik reguleerida ja on näha skaalal, mis vahemikus see liigub, siis jälgi, et üldiselt jääks see allapoole -6 dB taset. Kui on ainult klippimist näitav tuluke, siis jälgi, et see ei läheks põlema.
  • Kui salvestusseadmel ei ole salvestusnivood võimalik reguleerida, siis liiguta klippimise vältimiseks lihtsalt mikrofoni kõnelejast natuke kaugemale. Samas kui viia mikrofon kaugemale, siis hakkab tulemust rohkem mõjutama ruumi reverberatsioon ja välismürad. Optimaalne kaugus mikrofoni ja kõneleja vahel on paarkümmend sentimeetrit.
  • Paljudel diktofonidel on automaatne salvestustaseme reguleerimine, mida võimaluse korral tasuks aga välja lülitada, sest muidu ei ole võimalik salvestusest analüüsida signaali tugevust (SPL, sound pressure level).
  • Kui mikrofon on laua peal, mille taga salvestatav istub, siis jälgi, et ta ei toksiks sõrmedega lauale või ei nügi jalagadega lauajalga, sest see kandub mikrofoni üle väga suure lärmina. Parem on võimaluse korral kasutada eraldi mikrofonistatiivi ja paigutada see nii, et keegi sellele salvestamise ajal vastu ei läheks.

5.4 Väike ülevaade salvestusvahenditest

5.4.1 Diktofonid

Hea valik sisseehitatud mikrofonidega mälukaardile salvestavatest diktofonidest on Zoomil või Tascamil. Diktofoni valides võiks vaadata, et see töötaks USB-ga arvutiga ühendates ka mikrofonina (seadme tehnilises kirjelduses võiks olla märksõna USB Class Compliant) ning et tal oleks statiivikinnitus, siis saab seda vajadusel arvutis mikrofonina kasutada.

Natuke kallimatel diktofonidel võiks olla ka XLR sisendid ja fantoomtoide väliste kondensaatormikrofonide ühendamiseks. Sellisel juhul saab diktofonile ka natuke korralikuma mikrofoni ühendada.

5.4.2 Mikrofonid

Lihtsa dünaamilise mikrofoni tööpõhimõte on selline: mikrofoni membraani küljes on nõel ja membraani taga nõela ümber on magnet ning kui heli (õhuosakeste liikumine) paneb membraani liikuma, siis nõela liikumimine magnetväljas muundab selle elektrisignaaliks. Dünaamiline mikrofon ei ole väga tundlik, mistõttu tavalise kõne salvestamiseks ei ole see parim valik.

Kõne salvestamiseks kasutatakse üldiselt kondensaatormikrofoni, mis on võrreldes dünaamilise mikrofoniga oluliselt tundlikum, kuid vajab töötamiseks toidet. Tavaliselt ei ole kondensaatormikrofonile endale võimalik patareid sisse panna, vaid toide peaks tulema salvestusseadmest, mida nimetatakse fantoomtoiteks. Kui diktofon või helikaart võimaldab fantoomtoidet, siis võiks tal olla nupp kirjaga Phantom või +48V.11

Veel võib mikrofonid jagada suure ja väikse diafragamaga mikrofonideks. Stuudiotingimustes on hea kasutada suure diafragamaga mikrofone, aga need võivad olla väga kallid.

Väljaspool stuudiot, välitöö tingimustes ja eriti olukorras kus on mitu kõnelejat, võib olla hea valik kas lipsunõela- (lavaler) või peamikrofone. Nende eelis on, et taustamüra jääb vähem peale ja kui on korraga mitu kõnelejat, on võimalik ka pealerääkimise korral kõnelejaid enam-vähem eristada. Aga siis peab ka igal kõnelejal olema oma mikrofon ja kui kõnelejaid on rohkem kui kaks, siis peaks salvestusseadmel olema ka rohkem sisendeid. Kuna need mikrofonid on kõneleja küljes, siis peab jälgima seda, et kõneleja mikrofonile vastu ei läheks (nt käega vehkides või oma nägu puudutades), sest see teeb kõva lärmi. Peamikrofoni paigaldades võiks kõnelejal paluda ära võtta suuremad kõrvarõngad, kui need võivad kõnelemise ajal mikrofoni vastu puutuda.

Lisaks klassikalistele XLR-pistikuga helisalvestusseadmega ühendatavatele mikrofonidele, mis oma vajaliku fantoomtoite saavad salvestusseadmest, on ka päris häid nn podcasti ja youtuberi mikrofone, mis ühenduvad arvutiga USB-ga või Bluetoothiga ning täiendavat helikaarti üldse ei vajagi.

5.4.3 Helikaardid

Kui kasutad heli salvestamiseks arvutit ja klassikalist kondensaatormikrofoni, siis on vaja ka helikaarti, millel on mikrofoni eelvõimendi ja fantoomtoide. Kõige paremini sobib selleks USB-ga ühendatav väline helikaart. Ühe või kahe mikrofonisisendiga helikaardi hinnad võiks alata umbes 100 eurost.

5.4.4 Tarkvara

Heli salvestamiseks on väga erinevaid programme ja valik sõltub suuresti selles, milleks salvestust tarvis on. Ühe või kahe kanaliga salvestusi saab teha ka Praatiga (sellest põhjalikumalt peatükis 6.6), aga mõni muu programm võib sõltuvalt olukorrast olla mugavam. Pikemate spontaanse vestluse salvestuse tegemiseks ei ole Praat kõige mugavam ning rohkem kui kahte kanalit ei ole Praatiga korraga salvestada võimalik.

On suur valik kommertstarkvara muusika salvestamiseks ja miksimiseks, mis sobivad üldiselt ka kõne salvestamiseks. MacOS-iga tuleb kaasa programm nimega GarageBand, mis salvestamiseks sobib. Vabavaralistest seda tüüpi programmidest on üks populaarsemaid Audacity.

Mitme kanaliga (multitrack) salvestamise jaoks on palju profesionaalse stuudiotöö jaoks mõeldud programme, nagu näiteks Pro Tools või Cubase. Sageli tuleb mõni selline programm tasuta kaasa, kui ostad helikaardi.

Foneetika uurimiseks sõnade, lausete või lõikude kaupa loetud kõne salvestamiseks on väga sobilik Müncheni Ludwig Maximliani ülikoolis loodud SpeechRecorder (Draxler & Jänsch 2004). SpeechRecorderiga tuleb eelnevalt katse üles ehitada: sisesada nimekiri tekstidest, mida katseisik peab lugema. Katse käigus salvestatakse iga korraga ekraanil kuvatava teksti salvestus eraldi faili, mis säästab pärast salvestuse korrastamise vaevast.

Kirjandus

Draxler, Christoph & Klaus Jänsch. 2004. Speechrecorder – A Universal Platform Independent Multi-Channel Audio Recording Software. In Proceedings of 4th International Conference on Language Resources and Evaluation, 559–562. Lisbon.
Lippus, Pärtel, Kätlin Aare, Anton Malmi, Tuuli Tuisk & Pire Teras. 2023. Phonetic Corpus of Estonian Spontaneous Speech v1.3. Institute of Estonian and General Linguistics, University of Tartu. https://doi.org/10.23673/RE-438.

  1. On ka eraldi tüüp elektreetkondensaatormikrofone, mis saavad toite mikrofoni sees olevast kvartskristallist ja ei vaja eraldi toidet.↩︎