Agyérbetegségek 2003;9(3):18-23.

TÉNYEKEN ALAPULÓ ORVOSLÁS

Bizonyítékokon alapuló orvoslás: a vizsgálatok kritikus értékelése

dr. Hajdú Eleonóra (levelező szerző): Kelen Kórház, Kardiológiai Ambulancia, 1119 Budapest, Thán Károly utca 20. Telefax: 06 (1) 334-2696. dr. Tóthfalusi László: Semmelweis Egyetem, Gyógyszerhatástani Intézet, 1445 Budapest Pf. 37.


A közleményt a szerző a Cardiologia Hungaricában, Tényeken alapuló orvoslás a gyakorlatban címmel megjelent cikke alapján készítette (2003;33:49-54.).

Az evidenciákon alapuló klinikai döntés során az orvos integrálja a tapasztalatát a betegséggel kapcsolatos legjobb evidenciákkal, a beteg elvárásait is figyelembe véve. A bizonyítékokon alapuló orvoslás (evidence based medicine, EBM) magában foglalja a klinikai kérdésfeltevés, a válaszadás, az alkalmazás és az ellenőrzés teljes körét.

Az EBM elveit és módszertanát illetően számos forrás áll rendelkezésre úgy papíron, mint elektronikusan, magyar nyelven is. Ezek közül – a teljesség igénye nélkül – néhány példa: az EBM-TUDOR honlapon (http://tudor.szote.u-szeged.hu) a szakmai információk mellett gyakorlatilag teljes körű linkgyűjtemény is hozzáférhető; 1999 óta magyarul is kapható az EBM egyik alapműve (Sackett DL, Richardson WS, Rosenberg W, Haynes RB. Golden Book Kiadó); az Epidemiológiai szótárban a fogalmak gyakorlati igényű leírása szerepel, köztük számos a kritikus értékelés tárgyköréből (V. Hajdú P, Ádány R. Medicina Könyvkiadó, 2003).

Az evidence based medicine gyakorlata nem korlátozza a gyógyítás művészetét, sokkal inkább alapot szolgáltat hozzá. Ezen túl pedig biztonságot jelent mind jogi szempontból, mind pedig a félreérthető szakmai információkkal szemben.

Összefoglaló táblázatunkban az evidence based medicine egyik részterületével foglalkozunk: a vizsgálatok, ezen belül is az összehasonlító vizsgálatok kritikus értékelése során alkalmazott fogalmakra fokuszálunk abból a célból, hogy megkönnyítsük a vizsgálatok áradatából a lényeges és fontos vizsgálati eredmények felismerését (1. táblázat). A fogalmak jelentését és a kritikus értékelés szempontjából történő kommentálását a kritikus értékelés logikája mentén rendeztük sorba: milyen feltételek teljesülése esetén számíthatunk arra, hogy a vizsgálat érvényes, vagyis az eredmény igaz, valamint mely paraméterek bizonyítják az eredmény megbízhatóságát, jelentőségét, továbbá alkalmazhatóságát.

1. táblázat. Alapfogalmak a vizsgálatok kritikus értékeléséhez

A fogalom neve A fogalom jelentése Kommentár
Vizsgálatok
Kohorszvizsgálat (Beteg)csoport(ok) megfigyelése követés útján. Bizonyos biológiai, többnyire patológiás folyamatok következményeit méri egy jól definiált populáción.
Kontrollált vizsgálat (Beteg)csoport(ok)on végzett beavatkozás megfigyelése összehasonlítás révén. Célzott, többnyire mesterséges beavatkozás hatását méri egymáshoz hasonló csoportok között.
Prospektív vizsgálat A jövőben bekövetkező eseményekre vagy nyert adatokra vonatkozó vizsgálat.A prospektív tervezés lehetőséget nyújt arra, hogy a vizsgálat forgatókönyve minden részletében definiált és standardizált legyen abból a célból, hogy minimalizálja a véletlenszerű eltéréseket és a külső behatásokat.
Randomizált kontrollált vizsgálat (RCT) A vizsgálati populáció minden egyes tagjának véletlenszerű besorolása az egyes összehasonlítandó csoportokba.Az összehasonlítandó csoportok a vizsgálat indulásakor a kimenetelt meghatározó paramétereket illetően gyakorlatilag azonosak lesznek: a prospektív randomizált kontrollált vizsgálat tehát „zárt rendszer”: eredménye megfelelő statisztikai kritériumok teljesülése esetén bizonyosságot, magas szintű evidenciát jelenthet. Fontos etikai követelmény a „bizonytalanság princípiuma”: a vizsgálat elején nem dönthető el alapvető bizonyossággal, hogy melyik vizsgálati csoportban jár jobban a beteg.
Retrospektív vizsgálat A múltban bekövetkezett eseményekre vagy nyert adatokra vonatkozó vizsgálat.Múltbeli adatok feldolgozásakor sem az egykori külső behatások, sem a véletlenszerű eltérések kellő mértékű minimalizálása nem biztosítható: az eredmények bizonytalansága nem szorítható a magas szintű evidenciához szükséges szint alá.
RCT
Bevételi, kizárási kritériumok Mindazon paraméterek, amelyeknek fenn kell állnia (bevételi), illetve tilos fennállnia (kizárási) ahhoz, hogy a beteg a vizsgálatba kerülhessen. A betegpopuláció karakterisztikájáról van szó; ennek különösen két esetben van jelentősége: egyrészt a vizsgálat eredményének alkalmazásakor (az eredmény az adott populációra érvényes), másrészt, ha az eredményt egyéb vizsgálatokkal kívánjuk összehasonlítani vagy összevonni (nagyon eltérő populáción végzett vizsgálatok eredményei nem hasonlíthatók és nem vonhatók össze).
Kiindulási jellemzők A vizsgálat résztvevőinek releváns paraméterei a vizsgálat kezdetén.A paraméterek többnyire a résztvevők demográfiai adatai, valamint a vizsgált folyamat kimenetele vagy alakulása szempontjából meghatározó jelentőségű, egyéb klinikai adatok. A kiindulási jellemzőknek meg kell egyezniük az összehasonlításra kerülő csoportokban. Ez az elvárás randomizáció következtében általában teljesül. A randomizáció hibája eltérést okozhat, ami torzítja az eredményt.
Kettős vak kezelés Sem a beteg, sem az orvos nem ismeri, hogy a vizsgálati kezelési lehetőségek közül melyikben részesül a beteg. Az eredményt esetleg befolyásoló kezelés- és gondozásbeli különbségek kialakulását védi ki, amelyek befolyásolhatják az eredményt.
Végpontok, betegszám
Köztes végpont Olyan mérhető klinikai paraméter, amely a kórfolyamat patomechanizmusát tekintve nem közvetlenül vagy nem kizárólagosan befolyásolja a klinikai kimenetelt.A betegség végső kimenetelével nem kizárólagos oksági kapcsolatban lévő paraméternek a vizsgálat során mért bármilyen irányú (indirekt végpont) és mértékű változása önmagában nem mindig jelenti automatikusan azt, hogy a klinikai események is hasonló irányban és mértékben fognak változni a vizsgált kezelés következtében. Fontos részinformációkat szolgáltathatnak viszont például egy betegség patomechanizmusának vagy egy gyógyszer hatásának a pontosabb feltérképezéséhez, illetve az evidenciák testre szabott alkalmazásához.
Kemény végpont Az a klinikai esemény, amely maga a betegség kimenetele.Miután közvetlenül a betegség végső kimenetelét vizsgáljuk, ennek alakulása megfelelő feltételek teljesülése esetén valóban bizonyító erejű a vizsgált kezelésnek a klinikai eseményekre gyakorolt hatását illetően. Valódi kemény végpont szív- és érrendszeri betegségek esetében a halálozás, az infarktus és a szélütés. A többi, úgynevezett vascularis esemény már puha végpont, hiszen alakulásában már szerepet játszhat a definíció (például instabil angina), vagy az egészségügyi ellátás színvonala (például revascularisatio).
Betegszám, statisztikai erő Megmutatja, hogy mekkora az esélye annak, hogy a klinikailag fontos hatás statisztikailag is szignifikáns legyen: ez a vizsgálat ereje vagy szenzitivitása, amely a vizsgálat tervezésének fontos szempontja.Adott betegszám és a vizsgálatra jellemző paraméterek mellett megbecsülhető annak a valószínűsége, hogy a feltételezett hatás statisztikailag szignifikáns eredményt ad-e. Minél nagyobb a betegek száma, annál kisebb differenciát is ki tudunk mutatni statisztikailag különbözőnek. Ennek megfelelően a hatásosság megítélésében a klinikai hatás mértéke ad ésszerű határt. Nem etikus olyan vizsgálat végrehajtása, ahol a vizsgálatba bevont betegek kicsi száma mellett a fontosnak ítélt klinikai hatás nem mutatható ki, mert kicsi a vizsgálat statisztikai ereje. Tehát minél kisebb arányban előforduló eseménynek minél kisebb arányú csökkenését kívánják kellő statisztikai erővel kimutatni, annál nagyobb populációt kell bevonni a vizsgálatba, így annál nagyobb a betegszám. Évente 4%-os gyakorisággal előforduló esemény 15%-os csökkenésének 90%-os valószínűségű kimutatásához például 9000 beteg több évig tartó vizsgálata szükséges.
Primer végpont Elsődleges végpont: azon köztes vagy kemény végpont, amelynek változása a vizsgálat elsődleges célja. Egy vizsgálat egy kérdésre ad választA vizsgálat elsődleges célja, vagyis a vizsgálat elsődleges végpontjában mutatkozó eredmény alapján döntik el a vizsgálat sikerességét. Az elsődleges végpont szorosan összefügg a bevont betegek számával. Köztes végpontra (például a vérnyomásra) vonatkozó különbség <100 betegnél is eredményesen kimutatható. E betegszám sokszorosa szükséges azonban ahhoz, hogy a vizsgálat alkalmas legyen ugyanezen vérnyomáscsökkenésnek a klinikai kimenetelre, vagyis a kemény végpontra gyakorolt hatásának a kimutatására.
Szekunder végpont Másodlagos végpont: azon köztes vagy kemény végpont, amelyre nézve a vizsgálat folyamán az elsődleges végpont mellett adatokat gyűjtenek és elemeznek.A vizsgálat során számos egyéb, akár tudományos jellegű hipotézist vizsgálhatunk, azonban ezek eredménye nem a vizsgálat összefüggéseiből kiemelve értékelendő. Az elsődleges végpont megerősítésére alkalmasak, azonban önmagukban nem jelentenek magas szintű bizonyítékot még akkor sem, ha statisztikailag szignifikánsak. Különösen igaz ez kis esetszámú vizsgálatokra, amelyekben az elsődleges végpont köztes, és a klinikai végpont másodlagos. Hangsúlyozandó, hogy csak az előre tervezett végpontban született eredmény releváns.
Eredmények
Abszolút rizikó ( AR) A vizsgált klinikai esemény előfordulásának aránya vagy gyakorisága a vizsgálati csoport összes betegéhez képest (%).Mind a kezelt, mind pedig a kontrollcsoportban meghatározzák az esemény/összes beteg arányt.
Relatív rizikó (RR), odds ratio (OR)A klinikai események kezelt csoportban mért gyakoriságának aránya a kontrollcsoportban mért gyakorisághoz képest (%). Az OR hasonló jelentésű némileg más matematikai formában.Minél kisebb hányadát teszi ki a kezelt csoport abszolút rizikója a kontrollcsoport abszolút rizikójának, annál kedvezőbb a kezelés hatása.
Abszolútrizikó-csökkenés (ARR, absolute risk reduction)A kontroll- és a kezelt csoport abszolútrizikó-szintjének különbsége (%).Azt mutatja, hogy 100 beteg kezelése során hány beteg menekül meg egy vizsgálati eseménytől. Az érték reciproka pedig arról ad információt, hogy hány beteget kell kezelni egy esemény elkerüléséhez (NNT: number needed to treat).
Relatívrizikó-csökkenés (RRR, relative risk reduction)Az az érték, amennyivel a relatív rizikó kisebb 100%-nál.A kontrollcsoport abszolút rizikóját 100%-nak tekintve ennyivel kisebb a kezelt csoport abszolút rizikója. Ez az érték a vizsgálatok eredménye kemény végpont esetén. Ennek értéke viszont önmagában nem elegendő információ arra vonatkozóan, hogy az eredmény mennyire megbízható és milyen erősségű bizonyíték.
Az eredmény szórása A becsült paraméter várható eltérése az igazi értéktől: a vizsgálat mint mérés pontosságát jelzi. Minél kisebb az eredmény szórása, annál pontosabb az eredmény.Egy adott vizsgálatnál minél nagyobb az eredmény szórása, annál kevésbé egyértelmű az eredmény: ugyanis annál jobban eltér az átlagtól a minta egy-egy eleme. Minél több beteget vonnak be a vizsgálatba, annál kisebb az eredmény szórása, tehát nő az eredmény megbízhatósága.
Konfidenciaintervallum Megbízhatósági tartomány: az igazi paraméter a megadott százalékos valószínűséggel a becsült paraméter konfidenciaintervallumában helyezkedik el. A megadott %-ot nevezzük konfidenciaszintnek.Minél szűkebb a konfidenciaintervallum, annál megbízhatóbb az eredmény.
Konfidencialimit A konfidenciaintervallum határolópontjai. A konfidenciaintervallum és a statisztikai teszt (p-érték, szignifikancia) hasonló fogalmak. Például: ha két csoport átlagának 90%-os konfidenciaintervalluma nem fedi egymást, akkor két csoport statisztikailag szignifikánsan eltér egymástól. Azonosságuk esélye vagy a téves következtetés hibája <5%.
p-érték A téves következtetés hibája. Másképpen fogalmazva: annak az esélye, hogy a kezelt és kontrollcsoport között a vizsgálat végpontjára vonatkozóan nincsen különbség.Minél kisebb a p-érték, annál kisebb annak az esélye, hogy nincs különbség, vagyis annál kisebb a különbség fennállására vonatkozó téves következtetés hibája. Tehát azt jelenti, hogy van különbség.
Szignifikancia Megegyezés szerint <5% annak az esélye (p<0,05), hogy a kezelt és kontrollcsoport között a vizsgálat végpontjára vonatkozóan nincsen különbség.A relatív rizikó kismértékű csökkenése is lehet szignifikáns és szolgáltathat magas szintű evidenciát. Jelentős és szignifikáns relatívrizikó-csökkenés is jelenthet gyenge evidenciát, ha széles a konfidenciaintervallum, és az eredmény csak másodlagos végpontokban vagy alcsoportokban észlelhető, az elsődleges végpontban nem.
Alcsoportelemzés A végpontokra vonatkozó eredmények (kezelt versus kontroll) kiszámítása az összes vizsgálati beteg aszerint bontott csoportjaira, hogy bizonyos klinikai jellemzőkkel rendelkeznek-e vagy sem (például férfi-nő, hypertoniás-nem hypertoniás, diabeteses-nem diabeteses stb.).Az alcsoport-analízisek egyrészt megkönnyítik az eredmények alkalmazását, másrészt megerősíthetik egy eredmény érvényességét, ha valamennyi alcsoportban ugyanaz a kedvező hatás mutatkozik. A vizsgálat összefüggéseiből kiemelve nem szolgálnak jelentős bizonyító erővel, csakúgy, mint a másodlagos végpontok. Az adatvezérelt post hoc alcsoportok pedig egyenesen hibás következtetéshez vezethetnek. Csak a prospektíven meghatározott alcsoport-analízisek relevánsak.
Konzisztencia Az eredmények összecsengése.Egy vizsgálat elsődleges klinikai végpontjában mutatkozó statisztikailag szignifikáns eredmény jelentőségét fokozza, ha konzisztens a másodlagos végpontokban, illetve az alcsoportokban kapott eredményekkel. Mindig kellő körültekintéssel kell értékelni az egy-egy végpontban vagy alcsoportban kiragadottan mutatkozó szignifikáns eredmény megbízhatóságát.
Homogenitás Azonosság a vizsgálati csoportok összetétele, eredményei között.Az inhomogén csoportok eredményei kevéssé összehasonlíthatók, illetve az inhomogén eredmények egymással való helyettesítése vagy összevonása jelentős torzítást eredményezhet.
Metaanalízis Több hasonló vizsgálat összevont értékelése. Előnye, hogy az esetszám növekedésével nő a szenzitivitás – a statisztikai erő –, és ez növeli a megbízható eredmények lehetőségét. Hátránya, hogy gyakran nem lehet eleget tenni a homogenitás követelményének, miután hasonló célkitűzésű vizsgálatok számos részletben eltérhetnek egymástól. A komputerek korszakában a nagy vizsgálatok számítógépen rögzített és tárolt adatbázisainak egyesítésével számos korábbi ilyen jellegű akadály kiküszöbölhető.
A bizonyítékok szintjei RCT: 1++, 1+,1–
Kohorszvizsgálat: 2++, 2+, 2–
Esettanulmány, szakértői vélemény: 3–4.
Klinikai eseményre vonatkozó RCT-vizsgálat az alábbi feltételek teljesülése esetén tekinthető 1++ bizonyítéknak:
– elsődleges kemény végpontban mutatkozó szignifikáns és megbízható eredmény (magas konfidencialimit, keskeny konfidenciaintervallum);
– konzisztencia: belső, külső.
Az evidencia fokozatai Mega-RCT vagy RCT-k metaanalízise: A,
Kohorszvizsgálat: B, C
Esettanulmány, szakértői vélemény: D.
RCT-vizsgálat is szolgáltathat B-szintű evidenciát, ha fokozott a torzítás esélye. Szakértői vélemény mindig D-szintet jelent.
Az ajánlási osztályok A végső ajánlási osztályokba az evidencia fokozata és a szakértői csoportok egyetértési állásfoglalása alapján kerülnek az egyes eljárások aszerint, hogy hasznosnak és hatásosnak tarthatók-e vagy sem.
I. ajánlási osztály: mindazon körülmények, amelyekre vonatkozóan evidencia és/vagy egyetértés van az eljárás hasznosságáról és hatásosságáról.
II. ajánlási osztály: mindazon körülmények, amelyekre vonatkozóan ellentmondásosak az evidenciák és/vagy nincs egyetértés az eljárás hasznosságáról és hatásosságáról:
II/a: az evidenciák/vélemények inkább az eljárás hasznossága/hatásossága mellett szólnak;
II/b: az evidenciák/vélemények inkább az eljárás hasznossága/hatásossága ellen szólnak, mert ellentmondásos az evidenciaháttér és eltérnek a vélemények.
III. ajánlási osztály: mindazon körülmények, amelyekre vonatkozóan evidencia és/vagy egyetértés van arról, hogy az eljárás nem hasznos/hatásos, és egyes esetekben káros lehet.
Egyéb fogalmak
Odds ratioA relatív rizikóval analóg fogalom amely az esélyt a fogadásoknál használt terminológiával – például: három a kettőhöz – írja leFőleg matematikai előnyei miatt használt fogalom. Retrospektív analízisre is használható, szemben a relatív rizikóval vagy az abszolút rizikóval.
Kaplan–Meier-görbeEgy adott, általában nem kívánt esemény bekövetkezésének a valószínűsége az idő függvényében.Speciális eljárás a kockázat időfüggvényének becslésére; figyelembe veszi, hogy a kísérlet során egyes beteget nem tudnak nyomon követni, valamint azt, hogy a kísérlet ideje véges, ez alatt az esemény nem következik be. Két kezelés hatásossága úgy is mérhető, hogy az átlagos túlélési időtartam mennyiben tér el a két kezelés között. Ez a két Kaplan–Meier-görbe statisztikai összehasonlításával is elvégezhető (logrank teszt=Mantel Hanzel).
ITT (intention to treat) analízisA kísérlet adatait akkor is a protokollban rögzített módon analizálják, ha ettől eltértek. Például: a beteg eredményét akkor is számításba veszik, ha abbahagyta a kezelést. Ezzel szemben a per protokoll analízis során csak azoknak a betegeknek az adatait elemzik, akik végig követték a kezelést.Statisztikai eljárás az allokációs és a szelektív compliance-torzítás elkerülése céljából. A vizsgálat belső validitását jellemzi.
Study designA vizsgálat elrendezése.Alapvetően lehet párhuzamos vagy önkontrollos, de sok egyéb módosítás lehetséges.

Az áttekintéssel szeretnénk megkönnyíteni az eligazodást a mindennapi gyakorlat szintjén. A felsorolt fogalmak pontos definíciója és értelmezése több diszciplína, így például a klinikai farmakológia, a biostatisztika, a farmakoökonómia, epidemiológia stb. tárgykörébe tartozik. A klinikai vizsgálatok kritikus értékelésére vonatkozó módszertan háttér-információit teljes körben és kellő mélységben is integráló, átfogó gyakorlati útmutató elkészítése interdiszciplináris csapatmunkát igényel, és messze meghaladja jelen összefoglaló kereteit. Egy-egy vizsgálat konkrét elemzése, illetve egy-egy klinikai kérdéskör szisztematikus irodalmi áttekintése számos, részben szabadon is látogatható EBM-honlapon megtalálható, amelyek nagyrészt szerepelnek a TUDOR honlap linkgyűjteményében.

A szakmai irányelvek készítése során a rendelkezésre álló bizonyítékok besorolása azok kritikus értékelésén alapul; ezt többnyire standardizált és publikus kérdőívek (checklist) alkalmazásával végzik. Egy adott összehasonlító gyógyszervizsgálat eredményeképpen közölt adatok érdemi jelentőségének megítéléséhez a mindennapi gyakorlatban is elkerülhetetlen a kritikus értékelés.

Kérdéssor az összehasonlító vizsgálatok kritikus értékeléséhez*

Kérdés Válasz
IgenNemNincs adat/nem eldönthető
Egyértelmű-e a vizsgálat célja?   
Alkalmas-e a vizsgálat arra, hogy a kitűzött célt illetően az eredménye (elsődleges végpont) bizonyító értékű legyen?   
Megfelelő-e a vizsgálat statisztikai ereje, vagyis a bevont betegek száma alapján kellően szenzitív-e a feltételezett hatás kimutatására?   
Prospektív-e a vizsgálat, publikálták-e a vizsgálati tervet a végpontokkal és az alcsoport-analízisekkel?   
Randomizált-e a vizsgálat, azaz egyenlő eséllyel kerültek-e a betegek az összehasonlítandó kezelési csoportokba?   
Kettős vak módon végezték-e a kezelést?   
Klinikai kimenetel-e az elsődleges végpont, vagyis megfelelő mértékben érvényesül-e a vizsgálatban az oksági elv?   
„Intention to treat” elv szerint értékelik-e az eredményeket, vagyis elkerülik-e az allokációs és specifikus compliance-torzítást?   
Megbízható-e a vizsgálat eredménye (elsődleges végpont)?   
Kiegyenlítettek-e az összehasonlítandó csoportok a kiindulási jellemzők tekintetében?   
Szignifikáns-e az eredmény, vagyis kellően kicsi-e annak az esélye, hogy nincs különbség a kezelési csoportok eredménye között?   
Szűk-e a konfidenciaintervallum, vagyis a megbízhatósági tartomány, amelyen belül az igazi paraméter a konfidenciaszinttel megadott valószínűséggel elhelyezkedik?   
Konzisztens-e az eredmény a szekunder végpontokban mutatkozó eredményekkel?   
Konzisztens-e az eredmény az alcsoportokban mutatkozó eredményekkel?   
Jelentős-e az eredmény (elsődleges végpont)?   
Nagyobb mértékű-e a vártnál a relatív rizikó csökkenése?   
Számottevő-e az abszolút rizikó csökkenése?   
Elfogadható-e a mindennapi gyakorlatban a vizsgálat eredményéből számolható NNT?   
Konzisztens-e az eredmény a más szerekkel végzett, hasonló célkitűzésű vizsgálatok eredményével?   
Alkalmazható-e a bizonyíték?   
Hasonlít-e a vizsgálatba bevont populáció a mindennapi gyakorlatéhoz?   
Elfogadható mértékű-e a vizsgálati szer elhagyásának gyakorisága a vizsgálati csoportban?   
Elfogadható mértékű-e a mellékhatások gyakorisága a vizsgálati csoportban?   
Kellően megbízható-e a vizsgálat eredménye?   
Kellő mértékű-e a hatás ahhoz, hogy alkalmazzuk a vizsgált szert?   
*A mindennapi gyakorlat megkönnyítése érdekében, számos kérdőív áttekintése alapján állítottuk össze ezt a kérdéssort.