3 Diagnostilised testid
Mitmesuguste patsientidel teostatavate kliiniliste mõõtmiste eesmärk on välja selgitada, millise probleemiga või haigusega tegu on. Mõnikord on tegemist arvulise mõõtmistulemusega, mille puhul tulemust võrreldakse normiga või mingi kriitilise piiriga. Teinekord on tegemist kvalitatiivse mõõtmistulemusega (jah/ei), näiteks kas emakakaelast võetud Pap-testi proov sisaldab kasvajaeelseid rakulisi vähieelseid mutatsioone (CIN 1-3).
Diagnostiline test on meetod, mille eesmärk on haiguse olemasolu kinnitamine või ümberlükkamine patsiendil.
Näide 3.1 Mõned näited diagnostilistest testidest:
Mõnikord peetakse diagnostiliste testide all silmas vaid kiirteste, mis on enamasti soodsad, aga aeg-ajalt eksivad. Kui aga testi täpsuse mõõtmisest rääkida, siis võib diagnostilisteks testideks lugeda kõik mõõtmised/hindamised, mille tagajärel sünnib otsustus.
SLV tulemus
|
||
---|---|---|
Tegelikkus | Pos | Neg |
Pos | 80 | 5 |
(õige otsus) | (vale otsus) | |
Neg | 25 | 65 |
(vale otsus) | (õige otsus) |
Kui eeldada, et selle uuringu valim on üldkogumi suhtes esinduslik, siis võib järeldada, et
- SLV-ga suudetakse tuvastada \(80/85\approx 0,94\) ehk 94% haigetest;
- SLV-ga suudetakse tuvastada \(65/90\approx 0,72\) ehk 72% tervetest;
- neist, kes SLV-ga said positiivse tulemuse, on \(80/105 \approx 0,76\) ehk 76% tegelikult haiged;
- neist, kes SLV-ga said negatiivse tulemuse, on \(65/70 \approx 0,93\) ehk 93% tegelikult terved;
- SLV annab õige tulemuse \(150/175\approx0,83\) ehk 83% juhtudest.
Kõik ülalloetletud arvud kirjeldavad testi (SLV) erinevate nurkade alt ning neil on oma nimetused.
Lepime selles peatükis kokku, et tähistame sündmust, et inimese test on positiivne, sümboliga \(T+\), negatiivne vastavalt \(T-\); analoogselt tähistame sündmust, et inimene on haige, sümboliga \(H+\), terve vastavalt \(H-\).
Seega tundlikkus on tinglik tõenäosus: \(P(T+ | H+)\).
SLV näites oli tundlikkus (kui hästi “tundis” test ära haiged inimesed) 94%.
On oluline meeles pidada, et tundlikkus ei näita, kui suure tõenäosusega on inimene haige.
Üldiselt pole peaaegu ükski test 100% tundlik. See tähendab, et on mõningane tõenäosus, et haigel inimesel tuleb test negatiivne (valenegatiivne). Kui testi tundlikkus on teada, siis on selge, et valenegatiivse tulemuse tõenäosus on \[P(T-|H+) = 1 - P(T+|H+) = 1 - \text{tundlikkus}.\]
Teisisõnu spetsiifilisus = \(P(T-|H-)\). Süstlaloputusvedeliku näites oli spetsiifilisus HIV testimisel 72%.
Üldiselt pole peaaegu ükski test 100% spetsiifiline, st mõnikord annab test valepositiivse tulemuse. Selle saamise tõenäosus on seega \[P(T+|H-) = 1 - P(T-|H-) = 1 - \text{spetsiifilisus}.\]
Tundlikkus ja spetsiifilisus kirjeldavad seda, kui täpselt suudab test inimesi haigeks või terveks klassifitseerida. On oluline meeles pidada seda, et diagnostilist testi saab kasutada vaid sellises olukorras, kus testi väljatöötamisel kehtinud eeldused peavad paika. Näiteks hemoglobiinipõhine dopingutest võib kõrgmäestikus elvate rahvaste hulgas anda palju vigaseid tulemusi, kui test on välja töötatud merepinnatasandil elavate inimeste hulgas.
Mingi testi tundlikkust ja spetsiifilisust hinnatakse teadusuuringu abil. Seega – kuna taolistes uuringutes on kasutuse valim – sisaldavad need hinnangud alati valimi juhuslikkusest tulenevat viga.
Teisisõnu: \(PPV=P(H+|T+).\) Süstlaloputusvedeliku näites oli positiivne prognoosiväärtus 76%.
Teisisõnu: \(NPV=P(H-|T-).\) Süstlaloputusvedeliku näites oli negatiivne prognoosiväärtus 93%.
Süstlaloputusvedeliku näites oli testi täpsus 83%.
Seega oleks selles näites \(PPV = \frac{197}{197+28}\approx0,89\) ehk 89% ning \(NPV = \frac{65}{65+13} \approx 0,83\) ehk 83%. See võiks panna kulmu kerkima, sest eespool sai just näidatud, et selle testi PPV oli 76% ning NPV 93%.
Intuitiivseltki on üsna ootuspärane, et testi prognoositäpsus sõltub haiguse levimusest. Rahvastikus, kus testitavat haigust praktiliselt üldse ei esine, oleks positiivne test võrdlemisi ootamatu ja tekitaks suurt üllatust ja tähelepanu; teises rahvastikus, kus sama haigus on paljudel inimeste, ei oleks positiivne tulemus nii üllatav.
Positiivne prognoosiväärtus näitab, mitu % positiivsete testidega inimesed on tegelikult haiged.
\[PPV = \frac{\text{positiivse tulemusega inimesed, kes on haiged}}{\text{kõik positiivse tulemusega inimesed}}\]
Kuna kõigi positiivsete tulemuste hulgas on ka valenegatiivseid, saab nimetaja kirjutada kahe liidetavana:
\[PPV = \frac{\text{pos tulemusega inimesed, kes on haiged}}{\text{pos tulemusega inimesed, kes on haiged }+ \text{ pos tulemusega inimesed, kes on terved}}\]
Nagu ülalpool kirjeldatud, siis tõenäosus, et inimesel tuleb test positiivne, kui ta on haige (ehk lühidalt \(P(T+|H+)\)), on tundlikkus. Tõenäosus, et inimesel tuleb test positiivne (valepositiivne), kui ta on terve (lühidalt: \(P(T+|H-)\)), on \(1 - \text{spetsiifilisus}.\) Seega saab avaldise ümber kirjutada nii:
\[PPV = \frac{\text{haigete arv } \times \text{tundlikkus}}{\text{haigete arv } \times \text{tundlikkus } + \text{tervete arv }\times (1 - \text{spetsiifilisus})}\]
Kui uurime mingit rahvastikku, mille suurus on \(N\), siis haigete arv ja tervete arv sõltuvad otseselt levimusest: haigete arv = \(N \times \text{levimus}\) ning tervete arv = \(N \times (1 - \text{levimus})\). Seega
\[PPV = \frac{N\times \text{ levimus } \times \text{tundlikkus}}{N \times \text{ levimus } \times \text{tundlikkus } + N \times (1 - \text{ levimus })\times (1 - \text{spetsiifilisus})}\]
Rahvastiku suurus \(N\) taandub kenasti välja, järele jääb
\[PPV = \frac{\text{ levimus } \times \text{tundlikkus}}{\text{ levimus } \times \text{tundlikkus } + (1 - \text{ levimus })\times (1 - \text{spetsiifilisus})}\]
Kasutades levimuse tähistamiseks \(P(H+)\) (kui tõenäoline on, et (juhuslikult valitud inimene) on haige), saab teksti asendada sümbolitega:
\[PPV = \frac{P(H+)P(T+|H+)}{P(H+)P(T+|H+) + (1 - P(H+)) (1 - P(T-|H-))}\]
Analoogselt saab näidata, et
\[ NPV=P(H- \mid T-)=\frac{[1-\overset{\mbox{levimus}}{\overbrace{P(H+)}}]\cdot\overset{\mbox{spetsiifilisus}}{\overbrace{P(T-\mid H-)}}}{[1-P(H+)]\cdot P(T-\mid H-)+P(H+)\cdot[1-\underset{\mbox{tundlikkus}}{\underbrace{P(T+\mid H+)}}]} \\ =\frac{(1-\mbox{levimus})\cdot\mbox{spetsiifilisus}}{(1-\mbox{levimus})\cdot\mbox{spetsiifilisus}+\mbox{levimus}\cdot(1-\mbox{tundlikkus})} \]
3.1 ROC-kõver ja AUC
Tihti põhineb test mingi arvulise tunnuse väärtusel.
All on toodud seerumi kreatiinkinaasi (CK-MB) taseme väärtused ebastabiilse rinnaangiiniga (tavalises kirjas mustalt) ja südame müokardiinfarktiga patsientidel (paksus kirjas punaselt). Kas CK põhjal saab eristada üht haigust teisest, st diagnoosida infarkti?
23 | 43 | 53 | 62 | 73 | 88 | 103 | 118 | 157 | 257 | 360 | 962 |
33 | 45 | 54 | 63 | 73 | 88 | 104 | 121 | 162 | 297 | 363 | 1015 |
36 | 47 | 57 | 63 | 75 | 89 | 105 | 121 | 176 | 302 | 377 | 1143 |
37 | 48 | 57 | 65 | 80 | 90 | 105 | 122 | 180 | 307 | 390 | 1458 |
37 | 48 | 58 | 65 | 80 | 91 | 107 | 126 | 188 | 311 | 398 | 1955 |
41 | 48 | 58 | 66 | 83 | 94 | 108 | 130 | 196 | 325 | 545 | 2139 |
41 | 49 | 58 | 67 | 84 | 94 | 109 | 130 | 198 | 335 | 577 | 2200 |
41 | 52 | 60 | 71 | 85 | 95 | 111 | 139 | 226 | 347 | 629 | 3044 |
42 | 52 | 60 | 72 | 86 | 97 | 114 | 150 | 232 | 348 | 648 | 7590 |
42 | 52 | 60 | 72 | 88 | 100 | 116 | 155 | 257 | 351 | 894 | 11138 |
Kui CK taset kasutada diagnoosi panemiseks, siis millisest väärtusest alates peaks testitulemuse lugema positiivseks? Kui piiriks võtta 90 (st loeme haigeks kõik, kellel CK väärtus on 90 või enam), siis tundlikkus on 100%, aga spetsiiflisus on 57%. Võttes piiriks 362, saame 100%-lise spetsiiflisuse, aga tundlikkus on 70%.
Optimaalse piiri leidmiseks kasutatakse nn ROC-kõveraid (receiver operating characteristic): tundlikkuse (ehk õigepositiivse tulemuse tõenäosuse) ja valepositiivse tõenäosuse (1 - spetsiiflisus) graafkuid.
Ideaalsel diagnostilisel testil on tundlikkus konstantselt (igasuguse kriitilise piiri valiku puhul) 100% ja septsiiflisus samuti (st 1 - spetsiiflisus on konstantselt 0%). Sellisele testile vastav kõver näeks välja ristküliku-kujuline ning selle kõvera alune pindala (AUC, area under curve) oleks 1.
Täiesti mõttetu diagnostiline marker ei suudaks üldse haigeid tervetest eristada mitte ühegi kriitilise piiri puhul. Selline test annaks ühesuguse tõenäosusega positiivse tulemuse nii haigete kui ka tervete hulgas.
Järelikult: Kasutul markeril/testil on tundlikkus võrdne valepositiivse tulemuse tõenäosusega. Sellise testi ROC-kõver oleks sirge diagonaaljoon, kõvera alune pindala oleks 0,5 (sest ROC joonise puhul on tegemist ruuduga küljepikkustega 1 ja 1).
Diagnostikaks kasutatav marker on seda kasulikum, mida suurem on vastava kõvera alune pindala.
AUC tõlgendamine: Kui juhuslikult valida üks haige ja üks terve, siis kui suure tõenäosusega on haigel inimese markeri väärtus suurem kui tervel inimesel.
Valides ROC kõveralt kõige ülemise vasakpoolsema punkti, saame optimaalse kriitilise piiri, mille puhul on nii tundlikkus kui ka spetsiiflisus võrdselt maksimiseeritud.
Sõltuvalt kontekstist võib olla soov pigem maksimiseerida tundlikkust või hoopis pigem spetsiiflisust.