Glavni Drugo Analiza podatkov časa do dogodka

Analiza podatkov časa do dogodka

Pregled

Programska oprema

Opis

Spletne strani

Branja

Tečaji

Pregled

Ta stran na kratko opisuje vrsto vprašanj, ki jih je treba upoštevati pri analizi podatkov o času do dogodka, in vsebuje pripisan seznam virov za več informacij.

Opis

Kaj je edinstveno pri podatkih o času do dogodka (TTE)?

Podatki o času do dogodka (TTE) so edinstveni, ker rezultat interesa ni le, ali se je dogodek zgodil ali ne, temveč tudi, kdaj se je dogodek zgodil. Tradicionalne metode logistične in linearne regresije niso primerne, da bi lahko kot rezultat v model vključile tako dogodke kot čas. Tudi tradicionalne regresijske metode niso opremljene s cenzuriranjem, posebno vrsto manjkajočih podatkov, ki se pojavijo pri analizah časa do dogodka, ko preiskovanci v času spremljanja ne doživijo zanimivega dogodka. Ob prisotnosti cenzure je pravi čas do dogodka podcenjen. Razvite so bile posebne tehnike za podatke o TTE, o katerih bomo razpravljali v nadaljevanju, da bi uporabili delne informacije o vsaki osebi s cenzuriranimi podatki in zagotovili nepristranske ocene preživetja. Te tehnike vključujejo podatke iz več časovnih točk med preiskovanci in jih je mogoče uporabiti za neposreden izračun stopenj, časovnih razmerij in razmerij nevarnosti.

Kateri so pomembni metodološki vidiki podatkov o času do dogodka?

Pri analizi podatkov o času do dogodka ali preživetju obstajajo 4 glavni metodološki vidiki. Pomembno je imeti jasno opredelitev ciljnega dogodka, časovnega izvora, časovne lestvice in opisati, kako bodo udeleženci zapustili študijo. Ko so te natančno opredeljene, postane analiza bolj neposredna. Običajno obstaja en ciljni dogodek, vendar obstajajo razširitve analiz preživetja, ki omogočajo več dogodkov ali ponovljene dogodke.

Kakšen je časovni izvor?

Izvor časa je točka, na kateri se začne čas spremljanja. Podatki TTE lahko uporabljajo različne časovne izvore, ki so v veliki meri odvisni od zasnove študije, pri čemer ima vsak s tem povezane prednosti in pomanjkljivosti. Primeri vključujejo izhodiščni čas ali izhodiščno starost. Časovni izvor je mogoče določiti tudi z določeno značilnostjo, na primer z nastopom izpostavljenosti ali diagnozo. To je pogosto naravna izbira, če je rezultat povezan s to značilnostjo. Drugi primeri vključujejo rojstvo in koledarsko leto. Pri kohortnih študijah je časovni obseg najpogosteje čas študija.

Ali obstaja druga možnost za časovni obseg, razen časa na študiju?

Starost je še en pogosto uporabljen časovni obseg, pri katerem je izhodiščna doba čas, ko posamezniki zapustijo dogodek ali cenzurirajo starost. Modele s starostjo kot časovno lestvico lahko prilagodite učinkom koledarja. Nekateri avtorji priporočajo, da se kot časovna lestvica uporablja starost in ne čas na študiji, saj lahko daje manj pristranske ocene.

Kaj je cenzura?

Eden od izzivov, ki so značilni za analizo preživetja, je, da bodo le nekateri posamezniki doživeli dogodek do konca študije, zato čas preživetja za podskupino študijske skupine ni znan. Ta pojav se imenuje cenzura in se lahko pojavi na naslednje načine: udeleženec študije do konca študije še ni doživel ustreznega izida, na primer ponovitve ali smrti; udeleženec študije je izgubljen za nadaljnje spremljanje v obdobju študija; ali udeleženec študije doživi drugačen dogodek, ki onemogoča nadaljnje spremljanje. Tako cenzurirani intervalni časi podcenjujejo pravi, a neznani čas do dogodka. Za večino analitičnih pristopov se šteje, da je cenzura naključna ali neinformativna.

Obstajajo tri glavne vrste cenzure, desno, levo in intervalno. Če se dogodki zgodijo po koncu študije, so podatki cenzurirani desno. Podatki, ki jih cenzuriramo levo, se pojavijo, ko dogodek opazujemo, vendar natančen čas dogodka ni znan. Intervalno cenzurirani podatki se pojavijo, ko dogodek opazujemo, vendar udeleženci vstopajo in izstopajo iz opazovanja, zato natančen čas dogodka ni znan. Večina analitičnih metod preživetja je zasnovanih za desno cenzurirana opazovanja, vendar so na voljo metode za intervalne in levo cenzurirane podatke.

Kaj je vprašanje, ki vas zanima?

Pri izbiri analitičnega orodja naj vodi raziskovalno vprašanje, ki nas zanima. S podatki o TTE ima lahko raziskovalno vprašanje več oblik, kar vpliva na to, katera funkcija preživetja je najpomembnejša za raziskovalno vprašanje. Tri različne vrste raziskovalnih vprašanj, ki bi lahko zanimale podatke o TTE, vključujejo:

  1. Kolikšen delež posameznikov bo po določenem času ostal brez dogodka?

  2. Kolikšen delež posameznikov bo imel dogodek po določenem času?

  3. Kakšno je tveganje za dogodek v določenem trenutku med tistimi, ki so preživeli do tega trenutka?

Vsako od teh vprašanj ustreza različni vrsti funkcije, ki se uporablja pri analizi preživetja:

  1. Funkcija preživetja, S (t): verjetnost, da bo posameznik preživel dlje časa t [Pr (T> t)]

  2. Funkcija gostote verjetnosti, F (t) ali kumulativna funkcija incidence, R (t): verjetnost, da bo posameznik preživel čas, manjši ali enak t [Pr (T≤t)]

  3. Funkcija nevarnosti, h (t): trenutni potencial doživljanja dogodka v času t, odvisno od preživetja do takrat

  4. Kumulativna funkcija nevarnosti, H (t): integral funkcije nevarnosti od časa 0 do časa t, ki je enak površini pod krivuljo h (t) med časom 0 in časom t

Če je ena od teh funkcij znana, lahko druge funkcije izračunamo po naslednjih formulah:

S (t) = 1 - F (t) Funkcija preživetja in funkcija gostote verjetnosti sta enaki 1

h (t) = f (t) / S (t) Trenutna nevarnost je enaka brezpogojni verjetnosti

doživljanje dogodka v času t, pomanjšano za ulomek živ v času t

H (t) = -log [S (t)] Kumulativna funkcija nevarnosti je enaka negativnemu dnevniku preživetja

funkcijo

S (t) = e –H (t) Funkcija preživetja je enaka potencirani negativni kumulativni nevarnosti

funkcijo

Te pretvorbe se pogosto uporabljajo pri metodah analize preživetja, kot bo obravnavano v nadaljevanju. Na splošno bo povečanje h (t), trenutne nevarnosti, povzročilo povečanje H (t), kumulativne nevarnosti, kar pomeni zmanjšanje S (t), funkcije preživetja.

Katere predpostavke je treba sprejeti za uporabo standardnih tehnik za podatke o času do dogodka?

Glavna predpostavka pri analizi podatkov o TTE je neinformativna cenzura: posamezniki, ki so cenzurirani, imajo enako verjetnost, da bodo doživeli nadaljnji dogodek kot posamezniki, ki ostanejo v študiji. Informativno cenzuriranje je analogno nezanemarljivim manjkajočim podatkom, kar bo pristransko do analize. Ni mogoče dokončno preizkusiti, ali je cenzura neinformativna, čeprav raziskovanje vzorcev cenzure lahko kaže, ali je domneva o neinformativni cenzuri smiselna. Če sumimo na informativno cenzuriranje, lahko z analizami občutljivosti, kot so najboljši in najslabši scenariji, poskušamo količinsko opredeliti učinek informacijske cenzure na analizo.

Druga predpostavka pri analizi podatkov TTE je, da obstaja dovolj časa za spremljanje in število dogodkov za ustrezno statistično moč. To je treba upoštevati v fazi načrtovanja študije, saj večina analiz preživetja temelji na kohortnih študijah.

Omeniti velja še dodatne poenostavitvene predpostavke, ki so pogosto podane v pregledih analize preživetja. Čeprav te predpostavke poenostavljajo modele preživetja, ni treba izvajati analiz s podatki o TTE. Če so te predpostavke kršene, se lahko uporabijo napredne tehnike:

  • Brez kohortnega učinka na preživetje: za kohorto z dolgo zaposlitvijo predpostavimo, da imajo posamezniki, ki se pridružijo zgodaj, enake verjetnosti preživetja kot tisti, ki se pridružijo pozno

  • Prava cenzura samo v podatkih

  • Dogodki so neodvisni drug od drugega

Katere vrste pristopov lahko uporabimo za analizo preživetja?

Obstajajo trije glavni pristopi k analizi podatkov TTE: neparametrični, polparametrični in parametrični pristopi. Pri izbiri, kateri pristop naj uporabi, naj temelji raziskovalno vprašanje, ki nas zanima. Pogosto lahko v isti analizi primerno uporabimo več pristopov.

Kaj so neparametrični pristopi k analizi preživetja in kdaj so primerni?

Neparametrični pristopi se ne opirajo na predpostavke o obliki ali obliki parametrov v osnovni populaciji. V analizi preživetja se za opis podatkov uporabljajo neparametrični pristopi z oceno funkcije preživetja, S (t), skupaj z mediano in kvartili časa preživetja. Te opisne statistike ni mogoče izračunati neposredno iz podatkov zaradi cenzure, ki podcenjuje dejanski čas preživetja pri cenzuriranih preiskovancih, kar vodi do neenakomernih ocen povprečja, mediane in drugih opisov. Neparametrični pristopi se pogosto uporabljajo kot prvi korak v analizi za ustvarjanje nepristranskih deskriptivnih statistik in se pogosto uporabljajo skupaj s polparametričnimi ali parametričnimi pristopi.

Kaplan-Meierjev ocenjevalec

Najpogostejši neparametrični pristop v literaturi je Kaplan-Meierjev (ali omejitev izdelka) ocenjevalec. Ocenjevalec Kaplan-Meier deluje tako, da oceno S (t) razdeli na vrsto korakov / intervalov na podlagi opazovanih časov dogodkov. Opazovanja prispevajo k oceni S (t), dokler se dogodek ne zgodi ali dokler niso cenzurirani. Za vsak interval se izračuna verjetnost preživetja do konca intervala, glede na to, da so osebe na začetku intervala ogrožene (to je običajno označeno kot pj = (nj - dj) / nj). Ocenjeni S (t) za vsako vrednost t je zmnožek preživetja vsakega intervala do vključno časa t. Glavne predpostavke te metode so poleg neinformativne cenzure tudi, da se cenzura pojavi po neuspehih in da ni kohortnega učinka na preživetje, zato imajo preiskovanci enako verjetnost preživetja ne glede na to, kdaj so bili v študiji.

Ocenjeni S (t) iz Kaplan-Meierjeve metode lahko narišemo kot postopno funkcijo s časom na osi X. Ta ploskev je lep način za ponazoritev preživetja kohorte in se lahko uporabi tudi za oceno mediane (ko je S (t) ≤0,5) ali kvartilov časa preživetja. Te opisne statistike je mogoče izračunati tudi neposredno z uporabo Kaplan-Meierjevega ocenjevalnika. 95% intervali zaupanja (CI) za S (t) se zanašajo na transformacije S (t), da se zagotovi, da je 95% CI znotraj 0 in 1. Najpogostejša metoda v literaturi je ocenjevalnik Greenwood.

Ocenjevalec življenjske tabele

Ocenjevalec življenjske tabele funkcije preživetja je eden najzgodnejših primerov uporabljenih statističnih metod, ki se že več kot 100 let uporablja za opis umrljivosti v velikih populacijah. Ocenjevalec življenjske tabele je podoben metodi Kaplan-Meier, le da intervali temeljijo na koledarskem času namesto na opazovanih dogodkih. Ker metode življenjske tabele temeljijo na teh koledarskih intervalih in ne na posameznih dogodkih / časih cenzuriranja, te metode za oceno S (t) uporabljajo povprečno velikost tveganj na interval in morajo domnevati, da je cenzura potekala enakomerno v koledarskem časovnem intervalu. Zaradi tega ocenjevalnik življenjske tabele ni tako natančen kot Kaplan-Meierjev ocenjevalec, vendar bodo rezultati v zelo velikih vzorcih podobni.

Ocenjevalec Nelson-Aalen

Druga alternativa Kaplan-Meierju je ocenjevalnik Nelson-Aalen, ki temelji na uporabi postopka štetja za oceno kumulativne funkcije nevarnosti, H (t). Oceno H (t) lahko nato uporabimo za oceno S (t). Ocene S (t), pridobljene s to metodo, bodo vedno večje od ocene K-M, vendar bo razlika med obema metodama v velikih vzorcih majhna.

Ali se neparametrični pristopi lahko uporabljajo za eno spremenljivke ali multivariatne analize?

Neparametrične pristope, kot je Kaplan-Meierjev ocenjevalec, lahko uporabimo za izvajanje nespremenljivih analiz kategoričnih dejavnikov, ki nas zanimajo. Dejavniki morajo biti kategorični (bodisi v naravi bodisi v zvezni spremenljivki, razdeljeni na kategorije), ker se za vsako stopnjo kategorične spremenljivke oceni funkcija preživetja S (t), ki se nato primerja med temi skupinami. Ocenjeni S (t) za vsako skupino lahko narišemo in vizualno primerjamo.

S pomočjo testov na podlagi ranga lahko statistično preizkusimo tudi razliko med krivuljami preživetja. Ti testi primerjajo opazovano in pričakovano število dogodkov v vsaki časovni točki med skupinami pod ničelno hipotezo, da so funkcije preživetja med skupinami enake. Obstaja več različic teh testov, ki temeljijo na uvrstitvi, ki se razlikujejo glede na težo, določeno za vsako časovno točko pri izračunu statistike testa. Dva najpogostejša testa na podlagi rangov, ki ju opažamo v literaturi, sta test long ranga, ki daje vsaki časovni točki enako težo, in Wilcoxonov test, ki vsako časovno točko uteži s številom ogroženih oseb. Na podlagi te teže je Wilcoxonov test bolj občutljiv na razlike med krivuljami v začetku spremljanja, ko je ogroženih več oseb. Drugi testi, kot je test Peto-Prentice, uporabljajo uteži med tistimi log stopenj in Wilcoxonovimi testi. Preskusi, ki temeljijo na uvrstitvi, so podvrženi dodatni predpostavki, da je cenzura neodvisna od skupine, in vsi so omejeni z majhno močjo zaznavanja razlik med skupinami, ko se krivulje preživetja prečkajo. Čeprav ti preskusi zagotavljajo p-vrednost razlike med krivuljami, jih ni mogoče uporabiti za oceno velikosti učinka (p-vrednost log-testa pa je enakovredna p-vrednosti za kategorični dejavnik zanimanja za nespremenljiv Cox model).

Neparametrični modeli so omejeni, saj ne zagotavljajo ocen učinka in jih na splošno ni mogoče uporabiti za oceno učinka več dejavnikov, ki nas zanimajo (multivariatni modeli). Zaradi tega se v epidemiologiji pogosto uporabljajo neparametrični pristopi v povezavi s polovičnimi ali popolnoma parametričnimi modeli, kjer se običajno uporabljajo multivariatni modeli za nadzor zmede.

Ali je mogoče prilagoditi krivulje Kaplan-Meier?

Pogost mit je, da Kaplan-Meierjevih krivulj ni mogoče prilagoditi, kar je pogosto navedeno kot razlog za uporabo parametričnega modela, ki lahko generira kovariate prilagojene krivulje preživetja. Razvita pa je bila metoda za ustvarjanje prilagojenih krivulj preživetja z uporabo inverzne uteži verjetnosti (IPW). V primeru samo ene kovariate je mogoče IPW neparametrično oceniti in so enakovredne neposredni standardizaciji krivulj preživetja za študijsko populacijo. V primeru več kovariat je treba za oceno uteži uporabiti pol- ali popolnoma parametrične modele, ki se nato uporabijo za več kovarijantno prilagojene krivulje preživetja. Prednosti te metode so, da zanjo ne velja predpostavka o sorazmernih nevarnostih, lahko se uporablja za časovno spremenljive kovariate in lahko tudi za kontinuirane kovariate.

Zakaj potrebujemo parametrične pristope za analizo podatkov do dogodka?

Neparametrični pristop k analizi podatkov TTE se uporablja za preprosto opisovanje podatkov o preživetju glede na preiskovani dejavnik. Modeli, ki uporabljajo ta pristop, se imenujejo tudi nespremenljivi modeli. Pogosteje preiskovalce zanima odnos med več kovariatami in čas dogodka. Uporaba polparametričnih in popolnoma parametričnih modelov omogoča analizo časa do dogodka hkrati glede na številne dejavnike in daje ocene moči učinka za vsak sestavni dejavnik.

Kaj je polparametarski pristop in zakaj se tako pogosto uporablja?

kategorični imperativ kant

Coxov proporcionalni model je najpogosteje uporabljen multivariatni pristop za analizo podatkov o preživetju v medicinskih raziskavah. V bistvu gre za regresijski model časa do dogodka, ki opisuje razmerje med pojavnostjo dogodka, izraženo s funkcijo nevarnosti, in nizom kovarijant. Model Coxa je zapisan na naslednji način:

funkcija nevarnosti, h (t) = h0 (t) exp {β1X1 + β2X2 +… + βpXp}

Šteje se za polparametrični pristop, ker model vsebuje neparametrično komponento in parametrično komponento. Neparametrična komponenta je osnovna nevarnost, h0 (t). To je vrednost nevarnosti, ko so vse kovariate enake 0, kar poudarja pomen centriranja kovarijant v modelu za razložljivost. Ne zamenjujte izhodiščne nevarnosti z nevarnostjo v trenutku 0. Osnovna funkcija nevarnosti je ocenjena neparametrično, zato za razliko od večine drugih statističnih modelov časi preživetja ne bi smeli slediti določeni statistični porazdelitvi in ​​obliki izhodišča nevarnost je poljubna. Osnovne funkcije nevarnosti ni treba oceniti, da bi sklepali na relativno nevarnost ali razmerje nevarnosti. Zaradi te funkcije je Coxov model močnejši od parametričnih pristopov, ker ni občutljiv na napačno opredelitev izhodiščne nevarnosti.

Parametrično komponento sestavlja kovariatni vektor. Kovariatni vektor pomnoži izhodiščno nevarnost za enako količino ne glede na čas, zato je učinek katerega koli kovariata kadar koli med spremljanjem enak in to je osnova za predpostavko o sorazmernih nevarnostih.

Kakšna je predpostavka o sorazmernih nevarnostih?

Predpostavka o sorazmernih nevarnostih je ključnega pomena za uporabo in razlago Coxovega modela.

Po tej predpostavki obstaja stalna povezava med rezultatom ali odvisno spremenljivko in kovariatnim vektorjem. Posledice te predpostavke so, da so funkcije nevarnosti za kateri koli posamezni osebi v katerem koli trenutku sorazmerne, razmerje nevarnosti pa se s časom ne spreminja. Z drugimi besedami, če ima posameznik smrtno tveganje v nekem začetnem časovnem obdobju, ki je dvakrat večje kot pri drugem posamezniku, potem v vseh poznejših časovnih točkah tveganje smrti ostane dvakrat večje. Ta predpostavka pomeni, da morajo biti krivulje nevarnosti za skupine sorazmerne in se ne smejo prečkati. Ker je ta predpostavka tako pomembna, jo je vsekakor treba preizkusiti.

Kako preizkusite predpostavko o sorazmernih nevarnostih?

Obstajajo različne tehnike, tako grafične kot preskusne, za ocenjevanje veljavnosti predpostavke o sorazmernih nevarnostih. Ena od tehnik je preprosto načrtovanje Kaplan-Meierjevih krivulj preživetja, če primerjate dve skupini brez kovariat. Če se krivulje prekrižajo, se lahko krši predpostavka o sorazmernih nevarnostih. Pri majhnih študijah je treba upoštevati pomembno opozorilo pri tem pristopu. Z oceno krivulj preživetja pri študijah z majhno velikostjo vzorca je lahko povezana velika napaka, zato se krivulje lahko križajo tudi, če je izpolnjena predpostavka o sorazmernih nevarnostih. Komplementarna ploskev log-log je močnejši test, ki logaritem negativnega logaritma ocenjene funkcije preživelega nanese na logaritem časa preživetja. Če so nevarnosti sorazmerne med skupinami, bo ta ploskev dala vzporedne krivulje. Druga pogosta metoda za preizkušanje predpostavke o sorazmernih nevarnostih je vključitev termina za časovno interakcijo, da se ugotovi, ali se HR spreminja skozi čas, saj je čas pogosto krivec za nesorazmernost nevarnosti. Dokaz, da čas medsebojnega delovanja skupine * ni enak nič, je dokaz proti sorazmernim nevarnostim.

Kaj pa, če predpostavka o sorazmernih nevarnostih ne drži?

Če ugotovite, da predpostavka PH ne drži, vam ni treba nujno opustiti uporabe Coxovega modela. V modelu obstajajo možnosti za izboljšanje nesorazmernosti. Na primer, v model lahko vključite druge kovariate, bodisi nove kovariate, nelinearne izraze za obstoječe kovariate ali interakcije med kovariatami. Lahko pa analizirate stratifikacijo ene ali več spremenljivk. Ta ocenjuje model, v katerem je dovoljeno, da je izhodiščna nevarnost različna znotraj posameznega sloja, vendar so učinki kovariacij enaki v različnih plasteh. Druge možnosti vključujejo razdelitev časa na kategorije in uporabo spremenljivk indikatorjev, ki omogočajo spreminjanje razmerja nevarnosti skozi čas, in spreminjanje časovne spremenljivke analize (npr. Iz pretečenega časa v starost ali obratno).

Kako preverite primernost polparametričnega modela?

Poleg preverjanja kršitev predpostavke o sorazmernosti je treba preučiti še druge vidike ustreznosti modela. Statistične podatke, podobne tistim, ki se uporabljajo pri linearni in logistični regresiji, lahko uporabimo za izvajanje teh nalog pri modelih Cox z nekaterimi razlikami, vendar so bistvene ideje enake v vseh treh nastavitvah. Pomembno je preveriti linearnost kovariatnega vektorja, kar lahko storimo s preučevanjem ostankov, tako kot to počnemo pri linearni regresiji. Vendar ostanki v podatkih o TTE niso tako enostavni kot pri linearni regresiji, delno tudi zato, ker vrednost izida za nekatere podatke ni znana, ostanki pa so pogosto poševni. Za oceno modela Coxa, primernega za podatke TTE, je bilo razvitih več različnih vrst ostankov. Med drugim sta med drugim Martingale in Schoenfeld. Prav tako lahko pogledate ostanke, da prepoznate zelo vplivna in slabo prirejena opazovanja. Obstajajo tudi testi ustreznosti, ki so značilni za modele Cox, na primer test Gronnesby in Borgan ter napovedni indeks Hosmer in Lemeshow. AIC lahko uporabite tudi za primerjavo različnih modelov, čeprav je uporaba R2 problematična.

Zakaj uporabljati parametrični pristop?

Ena glavnih prednosti polparametričnih modelov je, da ni treba določiti osnovne nevarnosti, da bi ocenili razmerja nevarnosti, ki opisujejo razlike v relativni nevarnosti med skupinami. Mogoče pa je, da je sama ocena osnovne nevarnosti zanimiva. V tem primeru je potreben parametrični pristop. Pri parametričnih pristopih sta določena tako funkcija nevarnosti kot učinek kovarijant. Funkcija nevarnosti je ocenjena na podlagi predpostavljene porazdelitve v osnovni populaciji.

Prednosti uporabe parametričnega pristopa k analizi preživetja so:

  • Parametrični pristopi so bolj informativni kot ne- in polparametrični pristopi. Poleg izračunavanja relativnih ocen učinka jih lahko uporabimo tudi za napovedovanje časa preživetja, stopenj nevarnosti ter povprečnega in medianega časa preživetja. Uporabljajo se lahko tudi za napovedovanje absolutnega tveganja v daljšem časovnem obdobju in za načrtovanje kovariate prilagojenih krivulj preživetja.

  • Ko je parametrična oblika pravilno določena, imajo parametrični modeli večjo moč kot polparametrični modeli. So tudi učinkovitejši, kar vodi do manjših standardnih napak in natančnejših ocen.

  • Parametrični pristopi se za oceno parametrov zanašajo na največjo verjetnost.

  • Preostali parametrični modeli imajo znano obliko razlike med opaženim in pričakovanim.

Glavna pomanjkljivost uporabe parametričnega pristopa je v tem, da temelji na predpostavki, da je bila osnovna porazdelitev populacije pravilno določena. Parametrični modeli niso zanesljivi za napačno opredelitev, zato so polparametrični modeli pogostejši v literaturi in manj tvegani za uporabo, kadar obstaja negotovost glede osnovne porazdelitve populacije.

Kako izberete parametrično obliko?

Izbira ustrezne parametrične oblike je najtežji del parametrične analize preživetja. Specifikacijo parametrične oblike mora voditi hipoteza študije, skupaj s predhodnim znanjem in biološko verjetnostjo oblike osnovne nevarnosti. Če je na primer znano, da se smrtno tveganje takoj po operaciji močno poveča, nato pa zmanjša in izravna, bi bilo neprimerno določiti eksponentno porazdelitev, ki sčasoma predstavlja stalno nevarnost. Podatki se lahko uporabijo za oceno, ali se zdi, da navedeni obrazec ustreza podatkom, vendar bi te metode, ki temeljijo na podatkih, morale dopolnjevati in ne nadomeščati izbire, ki temelji na hipotezi.

Kakšna je razlika med modelom sorazmernih nevarnosti in modelom pospešenega časa okvare?

Čeprav je Coxov model sorazmernih nevarnosti polparametričen, so lahko modeli proporcionalnih nevarnosti tudi parametrični. Parametrične modele sorazmernih nevarnosti lahko zapišemo kot:

h (t, X) = h0 (t) exp (Xi β) = h0 (t) λ

kjer je izhodiščna nevarnost, h0 (t), odvisna samo od časa, t, ne pa tudi od X, in λ je za enoto značilna funkcija kovarijant, ki ni odvisna od t, ki prilagaja osnovno funkcijo nevarnosti navzgor ali navzdol. λ ne more biti negativna. V tem modelu je stopnja nevarnosti multiplikativna funkcija izhodiščne nevarnosti, razmerja nevarnosti pa je mogoče razlagati enako kot v polparametričnem modelu sorazmernih nevarnosti.

Modeli pospešenega časa okvare (AFT) so razred parametričnih modelov preživetja, ki jih je mogoče linearizirati tako, da vzamemo naravni dnevnik časa preživetja. Najenostavnejši primer modela AFT je eksponentni model, ki je zapisan kot:

ln (T) = β0 + β1X1 +…. + βpXp + ε *

Glavna razlika med modeli AFT in modeli PH je v tem, da modeli AFT predpostavljajo, da so učinki kovariacij multiplikativni na časovni lestvici, medtem ko modeli Cox uporabljajo lestvico nevarnosti, kot je prikazano zgoraj. Ocene parametrov iz modelov AFT se razlagajo kot učinki na časovni lestvici, ki lahko pospešijo ali upočasnijo čas preživetja. Exp (β)> 1 iz AFT modela pomeni, da faktor pospešuje čas preživetja ali vodi do daljšega preživetja. Izkušnje (β)<1 decelerates survival time (shorter survival). AFT models assume that estimated time ratios are constant across the time scale. A time ratio of 2, for example, can be interpreted as the median time to death in group 1 is double the median time to death in group 2 (indicated longer survival for group 1).

Nekatere porazdelitve napak je mogoče zapisati in razlagati kot PH in AFT modele (tj. Eksponentno, Weibull), druge so samo PH (tj. Gompertz) ali samo AFT modeli (tj. Log-logistične), druge pa niso niti PH niti AFT modeli (tj. namestitev zlitine).

Katere oblike lahko prevzamejo parametrični modeli?

Funkcija nevarnosti ima lahko kakršno koli obliko, dokler je h (t)> 0 za vse vrednosti t. Čeprav bi moralo biti primarno upoštevanje parametrične oblike predhodno poznavanje oblike izhodiščne nevarnosti, ima vsaka distribucija svoje prednosti in slabosti. Nekateri najpogostejši obrazci bodo na kratko razloženi, več informacij pa bo na voljo na seznamu virov.

Eksponentna porazdelitev

Eksponentna porazdelitev predpostavlja, da je h (t) odvisna samo od koeficientov modela in kovariacij in je sčasoma konstantna. Glavna prednost tega modela je, da je hkrati model sorazmernih nevarnosti in model pospešenega odpovedi, tako da lahko ocene učinka razlagamo bodisi kot razmerja nevarnosti bodisi kot časovna razmerja. Glavna pomanjkljivost tega modela je, da pogosto ni verjetno, da bi sčasoma prevzeli stalno nevarnost.

Weibullova distribucija

Weibullova porazdelitev je podobna eksponentni porazdelitvi. Medtem ko eksponentna porazdelitev prevzema stalno nevarnost, Weibullova porazdelitev prevzema monotono nevarnost, ki se lahko poveča ali zmanjša, ne pa oboje. Ima dva parametra. Parameter oblike (σ) nadzoruje, ali se nevarnost povečuje (σ1) (v eksponentni porazdelitvi je ta parameter nastavljen na 1). Parameter lestvice (1 / σ) exp (-β0 / σ) določa obseg tega povečanja / zmanjšanja. Ker se Weibullova porazdelitev poenostavi na eksponentno porazdelitev, kadar je σ = 1, lahko ničelno hipotezo, da je σ = 1, preizkusimo z Waldovim testom. Glavna prednost tega modela je, da je PH in AFT model, zato je mogoče oceniti tako razmerja nevarnosti kot časovna razmerja. Ponovno je glavna pomanjkljivost ta, da je predpostavka monotonosti osnovne nevarnosti v nekaterih primerih neverjetna.

Gompertz distribucija

Porazdelitev Gompertz je PH model, ki je enak log-Weibullovi porazdelitvi, zato je dnevnik funkcije nevarnosti linearni v t. Ta porazdelitev ima eksponentno naraščajočo stopnjo napak in je pogosto primerna za aktuarske podatke, saj se sčasoma tudi tveganje smrtnosti eksponentno povečuje.

Log-logistična distribucija

Log-logistična distribucija je model AFT z izrazom napake, ki sledi standardni logistični distribuciji. Lahko se prilega ne-monotonim nevarnostim in se na splošno najbolje prilega, kadar osnovna nevarnost naraste na vrh in nato pade, kar je verjetno za nekatere bolezni, kot je tuberkuloza. Log-logistična distribucija ni model PH, je pa model proporcionalnih verjetnosti. To pomeni, da zanj velja predpostavka o sorazmernih kvotah, prednost pa je v tem, da lahko koeficiente naklona razlagamo kot časovna razmerja in tudi kot razmerja verjetnosti. Na primer, razmerje verjetnosti 2 iz parametričnega logističnega modela bi razlagali kot verjetnost preživetja po času t med osebami z x = 1 dvakrat več kot verjetnost med osebami z x = 0.

Generalizirana gama (GG) porazdelitev

Splošna porazdelitev gama (GG) je pravzaprav družina porazdelitev, ki vsebuje skoraj vse najpogosteje uporabljene porazdelitve, vključno z eksponentno, Weibullovo, log normalno in gama porazdelitvijo. To omogoča primerjave med različnimi distribucijami. Družina GG vključuje tudi vse štiri najpogostejše vrste funkcij nevarnosti, zaradi česar je porazdelitev GG še posebej uporabna, saj lahko oblika funkcije nevarnosti pomaga optimizirati izbiro modela.

Spline pristop

Ker je edina splošna omejitev specifikacije osnovne funkcije nevarnosti ta, da je t (t)> 0 za vse vrednosti t, lahko za maksimalno fleksibilnost pri modeliranju oblike osnovne nevarnosti uporabimo spline. Omejeni kubični zlepki so ena izmed metod, ki je bila v zadnjem času v literaturi priporočena za parametrično analizo preživetja, saj ta metoda omogoča prožnost oblike, vendar omejuje, da je funkcija linearna na koncih, kjer so podatki redki. Spline je mogoče uporabiti za izboljšanje ocene in so koristni tudi za ekstrapolacijo, saj maksimirajo prileganje opazovanim podatkom. Če so pravilno določene, ocene učinkov iz modelov, ki se prilegajo z uporabo zlepkov, ne smejo biti pristranske. Kot pri drugih regresijskih analizah lahko izzivi pri prileganju zarezov vključujejo izbiro števila in lokacije vozlov ter težave s prekomernim prileganjem.

Kako preverite ustreznost parametričnega modela?

Najpomembnejša komponenta ocene ustreznosti parametričnega modela je preveriti, ali podatki podpirajo določeno parametrično obliko. To lahko vizualno ocenimo z grafičnim prikazom kumulativne nevarnosti na podlagi modela glede na Kaplan-Meierjevo ocenjeno funkcijo kumulativne nevarnosti. Če je navedena oblika pravilna, mora graf iti skozi izhodišče z naklonom 1. Preizkus Grønnesby-Borganove ustreznosti se lahko uporabi tudi za ugotovitev, ali se opaženo število dogodkov bistveno razlikuje od pričakovanega števila dogodkov v skupinah, ki se razlikujejo po ocenah tveganja. Ta test je zelo občutljiv na število izbranih skupin in ponavadi preveč liberalno zavrača nično hipotezo o ustreznosti, če je izbranih veliko skupin, zlasti v majhnih naborih podatkov. Če je izbrano premalo skupin, test ne more zaznati kršitev modela. Iz tega razloga se zdi preudarno, da se pri ugotavljanju, ali je navedena parametrična oblika smiselna, zanašamo samo na test primernosti.

AIC se lahko uporablja tudi za primerjavo modelov, ki se izvajajo z različnimi parametričnimi oblikami, z najnižjim AIC, ki kaže na najboljše prileganje. AIC ni mogoče uporabiti za primerjavo parametričnih in polparametričnih modelov, ker parametrični modeli temeljijo na opazovanih časih dogodkov, polparametrični modeli pa na podlagi vrstnega reda dogodkov. Tudi ta orodja bi bilo treba uporabiti za preverjanje, ali navedeni obrazec ustreza podatkom, vendar je verodostojnost določene osnovne nevarnosti še vedno najpomembnejši vidik izbire parametrične oblike.

Ko se določena parametrična oblika ugotovi, da se podatki dobro prilegajo, se lahko za izbiro med različnimi modeli, kot so preostale ploskve in preskusi ustreznosti, uporabijo podobne metode kot prej opisane za polproporcionalne modele nevarnosti.

Kaj pa, če se napovedovalci sčasoma spremenijo?

V zgoraj napisanih vzorčnih izjavah smo domnevali, da so izpostavljenosti med nadaljnjim spremljanjem konstantne. Izpostavljenosti z vrednostmi, ki se s časom spreminjajo, ali časovno spremenljive kovariate, lahko vključimo v modele preživetja tako, da spremenimo enoto analize iz posameznika v časovno obdobje, ko je izpostavljenost konstantna. To razdeli čas-čas posameznikov na intervale, ki jih vsaka oseba prispeva k naboru tveganj, izpostavljenih in neizpostavljenim za to kovariacijo. Glavna predpostavka vključevanja časovno spremenljive kovariate na ta način je, da učinek časovno spremenljive kovariate ni odvisen od časa.

Za Coxov model sorazmerne nevarnosti bi vključitev časovno spremenljivega kovariata imela obliko: h (t) = h0 (t) e ^ β1x1 (t). V parametrične modele je mogoče vključiti tudi časovno spremenljive kovariate, čeprav jih je nekoliko bolj zapleteno in težko razlagati. Parametrični modeli lahko za večjo prilagodljivost modelirajo tudi časovno spremenljive kovariate z uporabo zlepkov.

Na splošno je treba uporabiti časovno spremenljive kovariate, kadar se domneva, da je nevarnost bolj odvisna od poznejših vrednosti kovariate kot vrednosti kovariate na izhodišču. Pri izzivih, ki se pojavljajo s časovno spremenljivimi kovariatami, manjkajo podatki o kovariati v različnih časovnih točkah in potencialna pristranskost pri oceni nevarnosti, če je časovno spremenljiva kovariata dejansko posrednik.

Kaj je analiza konkurenčnih tveganj?

Tradicionalne metode analize preživetja predvidevajo, da se zgodi le ena vrsta dogodkov, ki nas zanimajo. Vendar obstajajo naprednejše metode, ki omogočajo preiskavo več vrst dogodkov v isti študiji, na primer smrt zaradi več vzrokov. Za te študije se uporablja analiza konkurenčnih tveganj, pri katerih se trajanje preživetja konča s prvim od več dogodkov. Potrebne so posebne metode, ker je analiziranje časa do vsakega dogodka posebej lahko pristransko. V tem kontekstu metoda KM ponavadi precenjuje delež oseb, ki doživljajo dogodke. Analiza konkurenčnih tveganj uporablja metodo kumulativne incidence, pri kateri je celotna verjetnost dogodka kadar koli vsota verjetnosti, značilne za dogodek. Modeli se navadno izvajajo tako, da vsakega udeleženca študije vpišemo večkrat - po enega na vrsto dogodka. Za vsakega udeleženca študije je čas do katerega koli dogodka cenzuriran glede na čas, ko je bolnik doživel prvi dogodek. Za več informacij obiščite stran advancedepidemiology.org na konkurenčna tveganja .

Kaj so šibki modeli in zakaj so uporabni za povezane podatke?

Povezani podatki o preživetju se lahko pojavijo zaradi ponavljajočih se dogodkov posameznika ali kadar so opazovanja združena v skupine. Zaradi pomanjkanja znanja ali izvedljivosti nekaterih kovariacij, povezanih z zanimivim dogodkom, morda ni mogoče izmeriti. Krhkosti modeli pripisujejo heterogenost, ki jo povzročajo neizmerjeni kovariati, tako da dodajo naključne učinke, ki multiplikativno delujejo na funkcijo nevarnosti. Krhki modeli so v bistvu razširitve Coxovega modela z dodajanjem naključnih učinkov. Čeprav obstajajo različne klasifikacijske sheme in nomenklatura, ki se uporabljajo za opis teh modelov, štirje najpogostejši tipi modelov krhkosti vključujejo deljeno, ugnezdeno, skupno in aditivno krhkost.

Ali obstajajo drugi pristopi k analiziranju podatkov o ponavljajočih se dogodkih?

Podatki o ponavljajočih se dogodkih so korelirani, saj se lahko znotraj iste teme zgodi več dogodkov. Čeprav so modeli krhkosti ena od metod za upoštevanje te korelacije pri ponavljajočih se analizah dogodkov, je preprostejši pristop, ki lahko to korelacijo tudi upošteva, uporaba robustnih standardnih napak (SE). Z dodatkom robustnih SE lahko analizo ponavljajočih se dogodkov izvedemo kot preprosto razširitev polparametričnih ali parametričnih modelov.

Čeprav je enostaven za izvedbo, obstaja več načinov za modeliranje podatkov o ponavljajočih se dogodkih z uporabo robustnih SE. Ti pristopi se razlikujejo po tem, kako opredeljujejo niz tveganj za vsako ponovitev. Na ta način odgovarjajo na nekoliko drugačna študijska vprašanja, zato naj izbira, kateri modelni pristop uporabiti, temelji na študijski hipotezi in veljavnosti predpostavk o modeliranju.

Postopek štetja ali pristop Andersen-Gill k modeliranju ponavljajočih se dogodkov predpostavlja, da je vsaka ponovitev neodvisen dogodek in ne upošteva vrstnega reda ali vrste dogodka. V tem modelu se čas spremljanja za vsak predmet začne na začetku študije in je razdeljen na segmente, ki jih določajo dogodki (ponovitve). Predmeti prispevajo k tveganju, določenemu za dogodek, če so takrat pod nadzorom (ni cenzurirano). Te modele je enostavno dodati kot Coxov model z dodatkom robustnega ocenjevalnika SE, razmerja nevarnosti pa se razlagajo kot učinek kovariate na stopnjo ponovitve v nadaljnjem obdobju. Ta model pa bi bil neprimeren, če predpostavka neodvisnosti ni smiselna.

Pogojni pristopi predpostavljajo, da subjekt ni ogrožen za naslednji dogodek, dokler se ne zgodi predhodni dogodek, in zato upoštevajo vrstni red dogodkov. Primerni so z uporabo stratificiranega modela s številko dogodka (ali številom ponovitev, v tem primeru) kot spremenljivko plasti in vključno z robustnimi SE. Obstajata dva različna pogojna pristopa, ki uporabljata različne časovne lestvice in imata zato različne sklope tveganj. Pristop s pogojno verjetnostjo za določanje časovnih intervalov uporablja čas od začetka študije in je primeren, kadar je interes v celotnem poteku ponavljajočega se dogodka. Pristop časovne vrzeli v bistvu ponastavi uro za vsako ponovitev z uporabo časa od prejšnjega dogodka za določitev časovnih intervalov in je bolj primeren, kadar so zanimive ocene učinka, značilne za dogodek (ali ponovitev).

Na koncu marginalni pristopi (znani tudi kot WLW - pristop Wei, Lin in Weissfeld) menijo, da je vsak dogodek ločen postopek, zato so subjekti ogroženi za vse dogodke od začetka spremljanja, ne glede na to, ali so imeli predhodni dogodek. Ta model je primeren, kadar naj bi bili dogodki posledica različnih osnovnih procesov, tako da bi subjekt lahko na primer doživel tretji dogodek, ne da bi doživel prvega. Čeprav se ta predpostavka zdi neverjetna pri nekaterih vrstah podatkov, na primer o ponovitvah raka, bi jo lahko uporabili za modeliranje ponovitev poškodb v določenem časovnem obdobju, ko bi preiskovanci v določenem časovnem obdobju lahko imeli različne vrste poškodb, ki nimajo naravnega reda. Mejni modeli se lahko prilegajo tudi z uporabo slojevitih modelov z robustnimi SE.

Branja

Namen tega projekta je bil opisati metodološke in analitične odločitve, s katerimi se lahko soočimo pri delu s podatki o času do dogodka, vendar nikakor ni izčrpen. Spodaj so navedeni viri za poglobitev teh tem.

Učbeniki in poglavja

Vittinghoff E, Glidden DV, Shiboski SC, McCulloch CE (2012). Regresijske metode v biostatistiki, 2. New York, NY: Springer.

  • Uvodno besedilo k linearnim, logističnim modelom, modelom preživetja in ponavljajočih se mer, najboljše za tiste, ki želijo osnovno izhodišče.

  • Poglavje o analizi preživetja ponuja dober pregled, ne pa tudi globine. Primeri temeljijo na STATA.

Hosmer DW, Lemeshow S, maj S. (2008) Uporabljena analiza preživetja: regresijsko modeliranje podatkov o času do dogodka, 2. izd. Hoboken, NJ: John Wiley & Sons, Inc.

  • Poglobljen pregled neparametričnih, polparametričnih in parametričnih modelov Coxa, najboljši za tiste, ki so dobro seznanjeni z drugimi statističnimi področji. Napredne tehnike niso podrobno opisane, vendar obstajajo sklici na druge posebne učbenike.

Kleinbaum DG, Klein M (2012). Analiza preživetja: besedilo, ki se samouči, 3. izd. New York, NY: Springer Science + Business Media, LLC

  • Odlično uvodno besedilo

Klein JP, Moeschberger ML (2005). Analiza preživetja: tehnike za cenzurirane in okrnjene podatke, 2. izd. New York, NY: Springer Science + Business Media, LLC

  • namenjena podiplomskim študentom, ta knjiga ponuja veliko praktičnih primerov

Therneau TM, Grambsch PM (2000). Modeliranje podatkov o preživetju: razširitev modela Cox. New York, NY: Springer Science + Business Media, LLC

  • Dober uvod v pristop k štetju in analiziranje koreliranih podatkov o preživetju. Avtor je napisal tudi paket za preživetje v R

Allison PD (2010). Analiza preživetja s pomočjo SAS: Praktični vodnik, 2. izd. Cary, NC: Inštitut SAS

  • Odlično uporabljeno besedilo za uporabnike SAS

Bagdonavicius V, Nikulin M (2002). Modeli pospešenega življenja: modeliranje in statistična analiza. Boca Raton, FL: Chapman & Hall / CRC Press.

  • Dober vir za več informacij o parametričnih in polparametričnih modelih pospešenega odpovedi ter kako se primerjajo s sorazmernimi modeli nevarnosti

Metodološki članki

Uvodni / pregledni članki

Hougaard P (1999). Osnove podatkov o preživetju. Biometrija 55 (1): 13-22. PMID: 11318147 .

Clark TG, Bradburn MJ, Love SB, Altman DG (2003). Analiza preživetja I. del: osnovni koncepti in prve analize. Br J Rak 89 (2): 232-8. PMID: 12865907

Clark TG, Bradburn MJ, Love SB, Altman DG (2003). Analiza preživetja, del II: multivariatna analiza podatkov - uvod v koncepte in metode. Br J Rak 89 (3): 431-6. PMID: 1288808

Clark TG, Bradburn MJ, Love SB, Altman DG (2003). Analiza preživetja, del II: multivariatna analiza podatkov - izbira modela in ocena njegove ustreznosti in ustreznosti. Br J Rak 89 (4): 605-11. PMID: 12951864

Clark TG, Bradburn MJ, Love SB, Altman DG (2003). Analiza preživetja IV. Del: nadaljnji koncepti in metode v analizi preživetja. Br J Rak 89 (5): 781-6. PMID: 12942105

  • Zgornja serija štirih člankov je odličen uvodni pregled metod v analizi preživetja, ki so izjemno dobro napisane in enostavne za razumevanje - zelo priporočljivo.

Starost kot časovna lestvica

Korn EL, Graubard BI, Midthune D (1997). Analiza časa do dogodka vzdolžnega spremljanja ankete: izbira časovnega obsega. Am J Epidemiol 145 (1): 72-80. PMID: 8982025

  • Prispevek zagovarja uporabo starosti kot časovne lestvice in ne časa na študiju.

Ingram DD, Makuc DM, Feldman JJ (1997). Re: Analiza časa do dogodka vzdolžnega spremljanja ankete: izbira časovne lestvice. Am J Epidemiol 146 (6): 528-9. PMID: 9290515 .

  • Komentirajte prispevek Korn, ki opisuje previdnostne ukrepe pri uporabi starosti kot časovne lestvice.

Thiébaut AC, Bénichou J (2004). Izbira časovnega obsega v Coxovi modelni analizi epidemioloških kohortnih podatkov: simulacijska študija. Stat Med 30; 23 (24): 3803-20. PMID: 15580597

  • Simulacijska študija prikazuje velikost pristranskosti za različne stopnje povezanosti med starostjo in kovariato, ki nas zanima, kadar čas v študiji uporabljamo kot časovno lestvico.

Canchola AJ, Stewart SL, Bernstein L, et al. Coxova regresija z uporabo različnih časovnih lestvic. Na voljo na: http://www.lexjansen.com/wuss/2003/DataAnalysis/i-cox_time_scales.pdf .

  • Lep članek, ki primerja 5 Coxovih regresijskih modelov z različnimi časi študija ali starostjo kot časovno lestvico s kodo SAS.

Cenzuriranje

Huang CY, Ning J, Qin J (2015). Semiparametrični sklep o verjetnosti za levo okrnjene in desno cenzurirane podatke. Biostatistika [epub] PMID: 25796430 .

  • Ta članek ima lep uvod v analizo cenzuriranih podatkov in ponuja nov postopek ocenjevanja porazdelitve časa preživetja z levo okrnjenimi in desno cenzuriranimi podatki. Je zelo gosta in ima napredno statistično usmerjenost.

Cain KC, Harlow SD, Little RJ, Nan B, Yosef M, Taffe JR, Elliott MR (2011). Pristranskost zaradi levega okrnjenja in leve cenzure v longitudinalnih študijah razvojnih in bolezenskih procesov. Am J Epidemiol 173 (9): 1078-84. PMID: 21422059 .

  • Odličen vir, ki z epidemiološkega vidika pojasnjuje pristranskost, ki je značilna za levo cenzurirane podatke.

Sun J, Sun L, Zhu C (2007). Testiranje modela proporcionalnih verjetnosti za podatke s cenzurno intervalno obdelavo. Življenjski podatki Anal 13: 37–50. PMID 17160547 .

  • Še en statistično zgoščen članek o niansiranem vidiku analize podatkov TTE, vendar ponuja dobro razlago intervalno cenzuriranih podatkov.

Robins JM (1995a) Analitična metoda za naključna preskušanja z informativnim cenzuriranjem: 1. del. Analni podatki o življenjski dobi 1: 241–254. PMID 9385104 .

Robins JM (1995b) Analitična metoda za naključna preskušanja z informativno cenzuro: II. Del. Življenjski podatki Anal. 1: 417–434. PMID 9385113 .

  • Dve članki, ki obravnavata metode obravnavanja informativne cenzure.

Neparametrične metode preživetja

Borgan Ø (2005) Kaplan-Meierjev ocenjevalec. Enciklopedija biostatistike DOI: 10.1002 / 0470011815.b2a11042

  • Odličen pregled Kaplan-Meierjevega ocenjevalnika in njegovega razmerja do Nelson-Aalenovega ocenjevalca

Rodríguez G (2005). Neparametrična ocena v modelih preživetja. Na voljo od: http://data.princeton.edu/pop509/NonParametricSurvival.pdf

  • Uvod v neparametrične metode in Coxov model sorazmerne nevarnosti, ki pojasnjuje razmerja med metodami z matematičnimi formulami

Cole SR, Hernan MA (2004). Prilagojene krivulje preživetja z inverzno utežjo verjetnosti.Računalniške metode Programi Biomed 75 (1): 35-9. PMID: 15158046

  • Opisuje uporabo IPW za ustvarjanje prilagojenih Kaplan-Meierjevih krivulj. Vključuje primer in makro SAS.

Zhang M (2015). Robustne metode za izboljšanje učinkovitosti in zmanjšanje pristranskosti pri ocenjevanju krivulj preživetja v randomiziranih kliničnih preskušanjih. Življenjski podatki Anal 21 (1): 119-37. PMID: 24522498

  • Predlagana metoda za kovariate prilagojene krivulje preživetja pri RCT

Polparametrične metode preživetja

Cox DR (1972) Regresijski modeli in življenjske tabele (z razpravo). J R Statist Soc B 34: 187–220.

  • Klasična referenca.

Christensen E (1987) Multivariatna analiza preživetja z uporabo Coxovega regresijskega modela.Hepatologija 7: 1346–1358. PMID 3679094 .

  • Na spodbudnem primeru opisuje uporabo Coxovega modela. Odličen pregled ključnih vidikov analize modela Cox, vključno s tem, kako prilagoditi model Coxa in preverjanje predpostavk o modelu.

Grambsch PM, Therneau TM (1994) Preskusi in diagnostika sorazmernih nevarnosti na podlagi ponderiranih ostankov. Biometrika 81: 515–526.

  • Poglobljen članek o preizkušanju predpostavke o sorazmernih nevarnostih. Dobra kombinacija teorije in napredne statistične razlage.

Ng’andu NH (1997) Empirična primerjava statističnih testov za oceno predpostavke o sorazmernih nevarnostih Coxovega modela. Stat Med 16: 611–626. PMID 9131751 .

  • Še en poglobljen članek o preizkušanju predpostavke o sorazmernih nevarnostih, ki vključuje razpravo o preverjanju ostankov in učinkih cenzure.

Parametrične metode preživetja

Rodrίguez, G (2010). Parametrični modeli preživetja. Na voljo od: http://data.princeton.edu/pop509/ParametricSurvival.pdf

  • kratek uvod v najpogostejše porazdelitve, ki se uporabljajo pri parametrični analizi preživetja

Nardi A, Schemper M (2003). Primerjava Coxa in parametričnih modelov v kliničnih študijah. Stanje Med 22 (23): 2597-610. PMID: 14652863

  • Ponuja dobre primere primerjave polparametričnih modelov z modeli, ki uporabljajo običajne parametrične porazdelitve, in se osredotoča na oceno ustreznosti modela

Royston P, Parmar MK (2002). Prilagodljivi parametrični modeli proporcionalnih nevarnosti in proporcionalnih verjetnosti za cenzurirane podatke o preživetju z uporabo pri prognostičnem modeliranju in oceni učinkov zdravljenja. Stat Med 21 (15): 2175-97. PMID: 12210632

  • Dobra razlaga za osnove modelov sorazmernih nevarnosti in verjetnosti ter primerjave s kubičnimi zlitinami

Cox C, Chu H, Schneider MF, Muñoz A (2007). Parametrična analiza preživetja in taksonomija funkcij nevarnosti za splošno porazdelitev gama. Statist Med 26: 4352–4374. PMID 17342754 .

  • Ponuja odličen pregled parametričnih metod preživetja, vključno s taksonomijo funkcij nevarnosti in poglobljeno razpravo o generalizirani družini gama porazdelitve.

Crowther MJ, Lambert PC (2014). Splošni okvir za parametrično analizo preživetja.Stat Med 33 (30): 5280-97. PMID: 25220693

  • Opisuje omejevalne predpostavke pogosto uporabljenih parametričnih porazdelitev in pojasnjuje metodologijo omejenega kubičnega сплаna

Sparling YH, Younes N, Lachin JM, Bautista OM (2006). Parametrični modeli preživetja za intervalno cenzurirane podatke s časovno odvisnimi kovariatami. Biometrija 7 (4): 599-614. PMID: 16597670

  • Razširitev in primer uporabe parametričnih modelov z intervalno cenzuriranimi podatki

Spreminjajoče se kovariate

Fisher LD, Lin DY (1999). Časovno odvisne kovariate v Coxovem modelu sorazmerne nevarnosti regresije. Annu Rev Javno zdravje 20: 145-57. PMID: 10352854

  • Temeljita in razumljiva razlaga časovno spremenljivih kovarijant v modelih Coxa z matematičnim dodatkom

Petersen T (1986). Opremljanje parametričnih modelov preživetja s časovno odvisnimi kovariatami. Appl Statist 35 (3): 281-88.

  • Gost članek, vendar s koristnim uporabnim primerom

Konkurenčna analiza tveganja

Glejte Konkurenčna tveganja

Tai B, Machin D, White I, Gebski V (2001) Analiza konkurenčnih tveganj pri bolnikih z osteosarkomom: primerjava štirih različnih pristopov. Stat Med 20: 661–684. PMID 11241570 .

  • Dober poglobljen članek, ki opisuje štiri različne metode analize podatkov o konkurenčnih tveganjih in za primerjavo teh štirih pristopov uporablja podatke iz randomiziranega preskušanja bolnikov z osteosarkomom.

Checkley W, Brower RG, Muñoz A (2010). Sklepanje o medsebojno izključujočih se konkurenčnih dogodkih z mešanico splošnih porazdelitev gama. Epidemiologija 21 (4): 557–565. PMID 20502337 .

  • Prispevek o konkurenčnih tveganjih z uporabo splošne porazdelitve gama.

Analiza gručastih podatkov in modelov šibkosti

Yamaguchi T, Ohashi Y, Matsuyama Y (2002) Modeli sorazmernih nevarnosti z naključnimi učinki za preučevanje osrednjih učinkov v multicentričnih kliničnih preskušanjih raka. Stat Methods Med Res 11: 221–236. PMID 12094756 .

  • Članek z odlično teoretično in matematično razlago upoštevanja združevanja v skupine pri analizi podatkov o preživetju iz večcentrskih kliničnih preskušanj.

O’Quigley J, Stare J (2002) Modeli sorazmernih nevarnosti s slabostmi in naključnimi učinki. Stat Med 21: 3219–3233. PMID 12375300 .

  • Primerjava modelov krhkosti in modelov naključnih učinkov.

Balakrishnan N, Peng Y (2006). Splošni model občutljivosti gama. Statist Med 25: 2797–2816. PMID

  • Članek o modelih krhkosti z uporabo splošne porazdelitve gama kot porazdelitve krhkosti.

Rondeau V, Mazroui Y, Gonzalez JR (2012). frailtypack: paket R za analizo koreliranih podatkov o preživetju z modeli krhkosti z uporabo kaznovane ocene verjetnosti ali parametrične ocene. Časopis za statistično programsko opremo 47 (4): 1-28.

  • R vinjeta z dobrimi osnovnimi informacijami o krhkih modelih.

Schaubel DE, Cai J (2005). Analiza grozdnih podatkov o ponavljajočih se dogodkih z uporabo stopnje hospitalizacije pri bolnikih z ledvično odpovedjo. Biostatistika 6 (3): 404-19. PMID 15831581 .

  • Odličen članek, v katerem avtorji predstavijo dve metodi za analizo grozdnih podatkov o ponavljajočih se dogodkih, nato pa rezultate predlaganih modelov primerjajo z rezultati na podlagi modela krhkosti.

Gharibvand L, Liu L (2009). Analiza podatkov o preživetju z grozdnimi dogodki. SAS Global Forum 2009, dokument 237-2009.

  • Kratek in enostaven za razumevanje vir za analizo podatkov o času do dogodkov s skupnimi dogodki s postopki SAS.

Analiza ponavljajočih se dogodkov

Twisk JW, Smidt N, de Vente W (2005). Uporabljena analiza ponavljajočih se dogodkov: praktični pregled. J Epidemiol Community Health 59 (8): 706-10. PMID: 16020650

  • Zelo lahko razumljiv uvod v modeliranje ponavljajočih se dogodkov in koncept nizov tveganj

Villegas R, Juliá O, Ocaña J (2013). Empirična študija koreliranih časov preživetja za ponavljajoče se dogodke s sorazmernimi mejami nevarnosti in učinek korelacije in cenzure.BMC Med Res Methodol 13:95. PMID: 23883000

  • S simulacijami preizkuša robustnost različnih modelov za podatke o ponavljajočih se dogodkih

Kelly PJ, Lim LL (2000). Analiza preživetja za podatke o ponavljajočih se dogodkih: aplikacija za otroške nalezljive bolezni. Stat Med 19 (1): 13-33. PMID: 10623190

  • Uporabljeni primeri štirih glavnih pristopov za modeliranje podatkov o ponavljajočih se dogodkih

Wei LJ, Lin DY, Weissfeld L (1989). Regresijska analiza večvariatnih nepopolnih podatkov o času okvare z modeliranjem mejnih porazdelitev. Časopis Ameriškega statističnega združenja84 (108): 1065-1073

Izvirni članek, ki opisuje obrobne modele za analizo ponavljajočih se dogodkov

Tečaji

Poletni inštitut za epidemiologijo in zdravje prebivalstva na univerzi Columbia (EPIC)

Statistična obzorja, zasebni ponudnik posebnih statističnih seminarjev, ki jih poučujejo strokovnjaki s tega področja

Meduniverzitetni konzorcij za politične in družbene raziskave (ICPSR) Poletni program kvantitativnih metod družbenih raziskav, del Inštituta za družbene raziskave na Univerzi v Michiganu

  • Tridnevni seminar o analizi preživetja, modeliranju zgodovine dogodkov in analizi trajanja, ki ga je od 22. do 24. junija 2015 v Berkeleyju v Kaliforniji predaval Tenko Raykov z Michigan State University. Izčrpen pregled metod preživetja v vseh disciplinah (ne samo v javnem zdravstvu): http://www.icpsr.umich.edu/icpsrweb/sumprog/courses/0200

Inštitut za statistične raziskave ponuja dva spletna tečaja za analizo preživetja, ki se ponujata večkrat na leto. Ti tečaji temeljijo na učbeniku za uporabno analizo avtorjev Klein in Kleinbaum (glej spodaj) in se lahko izvajajo po naročilu ali kot del programa za potrdila v statistiki:

Inštitut za digitalne raziskave in izobraževanje pri UCLA na svojem spletnem mestu ponujajo tako imenovane seminarje za analizo preživetja v različnih statističnih programih. Ti seminarji prikazujejo, kako izvajati uporabno analizo preživetja, pri čemer se osredotočajo bolj na kodo kot na teorijo.

Zanimivi Članki

Izbira Urednika

Viri cepiva COVID-19
Viri cepiva COVID-19
Pomoč sosedom pri iskanju storitev in najnovejših informacij o cepivu COVID-19.
Ekskluzivne štipendije in prakse
Ekskluzivne štipendije in prakse
Po diplomi imajo študentje priložnost, da se odpotujejo številnim posebnim plačanim podiplomskim delovnim mestom, ki trajajo od treh mesecev do enega leta. Nekatere priložnosti temeljijo na Columbiji. Drugi so na prodajnih mestih v ZDA in v tujini. Priložnosti se razvijajo vsako leto. Tu so navedena podjetja, ki so nedavno sodelovala. Informacije o prijavi bodo na voljo tukaj.
Ekranizacija sedmih kolumbijskih filmov v Cannesu 2021
Ekranizacija sedmih kolumbijskih filmov v Cannesu 2021
To so: Clara Sola, Murina, Libertad, Dol s kraljem in Ali si danes osamljen ?, ter kratka filma Céu de Agosto (avgustovsko nebo) in Ma Shelo Nishbar (Če ni zlomljeno).
Genij pri delu: Kako je Franz Boas ustvaril področje kulturne antropologije
Genij pri delu: Kako je Franz Boas ustvaril področje kulturne antropologije
Pred stoletjem, ko so ljudje verjeli, da inteligenco, empatijo in človeški potencial določajo rasa in spol, je Franz Boas pogledal podatke in se odločil, da se vsi motijo. V tem odlomku iz nove knjige Bogovi z zgornjega zraka je Charles King profiliral mavericka profesorja iz Kolumbije.
Ali lahko meditacija in joga pomagata zmanjšati tesnobo, povezano s COVID-19?
Ali lahko meditacija in joga pomagata zmanjšati tesnobo, povezano s COVID-19?
Študija na univerzi Columbia poskuša odpraviti povečan stres med pandemijo.
NPD proti mestu Zittau
NPD proti mestu Zittau
Global Columbia Global Freedom of Expression želi pospešiti razumevanje mednarodnih in nacionalnih norm in institucij, ki najbolje varujejo prosti pretok informacij in izražanja v medsebojno povezani svetovni skupnosti z glavnimi skupnimi izzivi. Da bi dosegel svoje poslanstvo, Global Freedom of Expression izvaja in naroča raziskovalne in politične projekte, organizira dogodke in konference ter sodeluje in prispeva k globalnim razpravam o zaščiti svobode izražanja in informacij v 21. stoletju.
Jane M. Spinak
Jane M. Spinak
Jane M. Spinak, priznana zagovornica dobrobiti otrok in mladoletniškega pravosodja, je soustanovila klinike Columbia Law, ki so se osredotočale na zastopanje družin in otrok. Spinak trenutno vodi kliniko za zastopanje mladostnikov, ki zastopa najstnike in mlade odrasle, ki ostajajo iz rejništva. Od leta 2001 do 2006 je bil Spinak direktor kliničnega izobraževanja na pravni fakulteti. Spinak je specializiran za mladoletniško pravosodje, zagovorništvo otrok in reformo družinskega sodišča - poučevanje, pisanje, predavanje in mentorstvo študentom, ki jih zanimajo javne službe. Njena sedanja štipendija se osredotoča na zgodovino in učinkovitost Družinskega sodišča. Napisala je knjige in članke za otrokove zagovornike, odvetnike in sodnike; sodeloval je v številnih odborih in delovnih skupinah, ki se ukvarjajo s potrebami in pravicami otrok in družin; in je o teh vprašanjih veliko izobraževal in predaval pravnikom, socialnim delavcem in strokovnjakom za duševno zdravje. Spinak poučuje tudi poklicno odgovornost in zunanji program Pro Bono Scholars. Preden se je leta 1982 pridružil pravni fakulteti Columbia, je Spinak delal kot uslužbenec v oddelku za pravice mladoletnikov pri Društvu za pravno pomoč v New Yorku. Med letoma 1995 in 1998 je bil Spinak na dopustu iz Kolumbije kot odvetnik oddelka za pravice mladoletnikov. Spinak je član Stalne pravosodne komisije za pravosodje za otroke v državi New York in je član Županovega svetovalnega odbora za sodstvo. Med letoma 2008 in 2011 je bila sopredsednica projektne skupine za družinsko sodišče v New Yorku, ki jo je ustanovilo Združenje pravnikov okrožja New York. Je svetovalka za ALI-jevo preoblikovanje zakona, otrok in zakona. Bila je predsednica ustanovnega odbora Centra za zastopanje družin, zagovorniške in politične organizacije, ki skrbi za zagotavljanje pravic staršev v postopkih za zaščito otrok, in še naprej deluje v upravnem odboru centra.