עיקרי אַחֵר ניתוח נתונים בזמן לאירוע

ניתוח נתונים בזמן לאירוע

סקירה כללית

תוֹכנָה

תיאור

אתרים

קריאות

קורסים

סקירה כללית

דף זה מתאר בקצרה סדרת שאלות שיש לקחת בחשבון בעת ​​ניתוח נתוני זמן לאירוע ומספק רשימת משאבים מוסברת למידע נוסף.

תיאור

מה הייחודי בנתוני זמן לאירוע (TTE)?

נתוני זמן לאירוע (TTE) הם ייחודיים מכיוון שתוצאת העניין היא לא רק אם אירוע התרחש או לא, אלא גם כאשר אירוע זה התרחש. שיטות מסורתיות של רגרסיה לוגיסטית וליניארית אינן מתאימות כדי לכלול את היבט האירוע ואת הזמן כתוצאה במודל. שיטות רגרסיה מסורתיות גם אינן מצוידות לטיפול בצנזורה, סוג מיוחד של נתונים חסרים המתרחש בניתוחי זמן לאירוע כאשר הנבדקים אינם חווים אירוע של עניין בזמן המעקב. בנוכחות צנזורה, מזלזל בזמן האמיתי לאירוע. טכניקות מיוחדות לנתוני TTE, כפי שנדון בהמשך, פותחו כדי להשתמש במידע החלקי על כל נושא עם נתונים מצונזרים ולספק אומדני הישרדות בלתי משוחדים. טכניקות אלה משלבות נתונים ממספר נקודות זמן על פני נבדקים וניתן להשתמש בהן לחישוב ישיר של שיעורים, יחסי זמן ויחסי סכנה.

מהם שיקולים מתודולוגיים חשובים של נתוני זמן לאירוע?

ישנם 4 שיקולים מתודולוגיים עיקריים בניתוח נתוני זמן לאירוע או הישרדות. חשוב שתהיה הגדרה ברורה של אירוע היעד, מקור הזמן, סולם הזמן, ותיאר כיצד המשתתפים ייצאו מהמחקר. ברגע שאלה מוגדרים היטב, אז הניתוח נעשה ישר יותר קדימה. בדרך כלל יש אירוע יעד יחיד, אך יש הרחבות של ניתוחי הישרדות המאפשרים אירועים מרובים או אירועים חוזרים.

מה מקור הזמן?

מקור הזמן הוא הנקודה בה מתחיל זמן המעקב. נתוני TTE יכולים להשתמש במגוון מקורות זמן שנקבעים במידה רבה על ידי תכנון המחקר, ולכל אחד מהם יתרונות וחסרונות נלווים. דוגמאות כוללות זמן בסיס או גיל בסיס. מקורות הזמן יכולים להיקבע גם על ידי מאפיין מגדיר, כגון תחילת חשיפה או אבחון. זוהי בדרך כלל בחירה טבעית אם התוצאה קשורה למאפיין זה. דוגמאות אחרות כוללות לידה ושנה קלנדרית. ללימודי עוקבה, סולם הזמן הוא לרוב זמן הלימוד.

האם קיימת אפשרות אחרת להיקף זמן שאינו זמן הלימודים?

גיל הוא עוד סולם זמן נפוץ, שבו גיל הבסיס הוא מקור הזמן ויחידים יוצאים בגיל האירוע או הצנזורה שלהם. ניתן להתאים דגמים עם הגיל כסולם הזמן לאפקטים של לוח השנה. מחברים מסוימים ממליצים להשתמש בגיל ולא בזמן במחקר כסקף הזמן מכיוון שהוא עשוי לספק הערכות פחות מוטות.

מהי צנזורה?

אחד האתגרים הספציפיים לניתוח ההישרדות הוא שרק חלק מהאנשים יחוו את האירוע בסוף המחקר, ולכן זמני ההישרדות לא יהיו ידועים עבור קבוצת משנה של קבוצת המחקר. תופעה זו נקראת צנזורה ועשויה להתעורר בדרכים הבאות: המשתתף במחקר טרם חווה את התוצאה הרלוונטית, כגון הישנות או מוות, בסיום המחקר; משתתף המחקר אבד ממעקב במהלך תקופת המחקר; או, משתתף המחקר חווה אירוע אחר שהופך את המעקב הלא אפשרי לבלתי אפשרי. זמני מרווחים מצונזרים כאלה ממעיטים בזמן האמיתי אך הלא ידוע לאירוע. עבור רוב הגישות האנליטיות, ההנחה כי הצנזורה היא אקראית או לא אינפורמטיבית.

ישנם שלושה סוגים עיקריים של צנזורה, ימינה, שמאל ומרווח. אם האירועים מתרחשים מעבר לסוף המחקר, אז הנתונים מצונזרים נכון. נתונים מצונזרים שמאל מתרחשים כאשר האירוע נצפה, אך זמן האירוע המדויק אינו ידוע. נתונים מצונזרים מרווחים מתרחשים כאשר האירוע נצפה, אך המשתתפים נכנסים ויוצאים מהתצפית, כך שזמן האירוע המדויק אינו ידוע. רוב השיטות לניתוח ההישרדות מיועדות לתצפיות מצונזרות ימנית, אך קיימות שיטות לנתונים מרווחים ומצונזרים שמאל.

מהי שאלת העניין?

הבחירה בכלי אנליטי צריכה להיות מונחית על ידי שאלת המחקר המעניינת. עם נתוני TTE, שאלת המחקר יכולה ללבוש מספר צורות, המשפיעות על איזו פונקציה הישרדותית היא הרלוונטית ביותר לשאלת המחקר. שלושה סוגים שונים של שאלות מחקר שעשויות לעניין את נתוני ה- TTE כוללים:

  1. איזה אחוז מהאנשים יישאר חופשי מהאירוע לאחר זמן מסוים?

  2. איזה חלק מהאנשים יקיים את האירוע לאחר זמן מסוים?

  3. מה הסיכון של האירוע בנקודת זמן מסוימת, בקרב אלו ששרדו עד אותה נקודה?

כל אחת משאלות אלה מתכתבת עם סוג אחר של פונקציה המשמשת לניתוח הישרדות:

  1. פונקצית הישרדות, S (t): ההסתברות שאדם ישרוד מעבר לזמן t [Pr (T> t)]

  2. פונקציית צפיפות הסתברות, F (t) או פונקציית ההיארעות המצטברת, R (t): ההסתברות שלאדם יהיה זמן הישרדות קטן או שווה ל- t [Pr (T≤t)]

  3. פונקציית סכנה, h (t): הפוטנציאל המיידי לחוות אירוע בזמן t, מותנה בכך ששרד עד אותה תקופה

  4. פונקציית מפגע מצטבר, H (t): האינטגרל של פונקציית המפגע מזמן 0 לזמן t, השווה לשטח שמתחת לעקומה h (t) בין הזמן 0 לזמן t

אם אחת מהפונקציות הללו ידועה, ניתן לחשב את הפונקציות האחרות באמצעות הנוסחאות הבאות:

S (t) = 1 - F (t) פונקציית ההישרדות ופונקציית צפיפות ההסתברות סכום ל -1

h (t) = f (t) / S (t) הסכנה המיידית שווה את ההסתברות הבלתי מותנית של

חווה את האירוע בזמן t, מוקטן לפי השבר החי בזמן t

H (t) = -log [S (t)] פונקציית הסיכון המצטבר שווה לוג השלילי של ההישרדות

פוּנקצִיָה

S (t) = e –H (t) פונקציית ההישרדות שווה לסכנה המצטברת השלילית המופקרת

פוּנקצִיָה

המרות אלה משמשות לעיתים קרובות בשיטות ניתוח הישרדות, כפי שיידון בהמשך. באופן כללי, עלייה ב- h (t), הסכנה המיידית, תוביל לעלייה ב- H (t), הסכנה המצטברת, שמתורגמת לירידה ב- S (t), פונקציית ההישרדות.

אילו הנחות יש להניח כדי להשתמש בטכניקות סטנדרטיות לנתונים בזמן לאירוע?

ההנחה העיקרית בניתוח נתוני TTE היא של צנזורה לא אינפורמטיבית: אנשים שצונזרו הם בעלי אותה הסתברות לחוות אירוע עוקב כמו אנשים שנותרו במחקר. צנזורה אינפורמטיבית מקבילה לנתונים חסרים שאינם ניתנים לביטול, אשר יטו את הניתוח. אין דרך מוחלטת לבדוק האם צנזורה אינה אינפורמטיבית, אם כי בחינת דפוסי צנזורה עשויה להצביע האם הנחה של צנזורה לא אינפורמטיבית היא סבירה. אם יש חשד לצנזורה אינפורמטיבית, ניתן להשתמש בניתוחי רגישות, כגון תרחישים מהמקרים הטובים ביותר והמקרים הגרועים ביותר, בכדי לנסות לכמת את ההשפעה שיש לצנזורה אינפורמטיבית על הניתוח.

הנחה נוספת בעת ניתוח נתוני TTE היא שיש מספיק זמן מעקב ומספר אירועים בכוח סטטיסטי הולם. יש להתחשב בכך בשלב תכנון המחקר, מכיוון שרוב ניתוחי ההישרדות מבוססים על מחקרי קבוצה.

ראוי להזכיר הנחות מפשטות נוספות, מכיוון שהן נעשות לעתים קרובות בסקירות של ניתוח ההישרדות. הנחות אלו אמנם מפשטות מודלים של הישרדות, אך אין צורך לבצע ניתוחים עם נתוני TTE. ניתן להשתמש בטכניקות מתקדמות אם ההנחות הללו מופרות:

  • אין השפעה עוקבת על הישרדות: עבור קבוצה עם תקופת גיוס ארוכה, הנח כי אנשים המצטרפים מוקדם הם בעלי ההסתברות ההישרדותית כמו אלה המצטרפים מאוחר.

  • צנזורה נכונה רק בנתונים

  • האירועים אינם תלויים זה בזה

באילו סוגי גישות ניתן להשתמש לניתוח הישרדותי?

ישנן שלוש גישות עיקריות לניתוח נתוני TTE: גישות לא פרמטריות, חצי פרמטריות ופרמטריות. הבחירה באיזו גישה להשתמש צריכה להיות מונעת על ידי שאלת המחקר המעניינת. לעיתים קרובות, ניתן להשתמש כראוי בגישה אחת באותה ניתוח.

מהן גישות לא פרמטריות לניתוח הישרדות ומתי הן מתאימות?

גישות שאינן פרמטריות אינן נשענות על הנחות לגבי צורת הפרמטרים או צורתם באוכלוסייה הבסיסית. בניתוח ההישרדות משתמשים בגישות שאינן פרמטריות לתיאור הנתונים על ידי אומדן פונקציית ההישרדות, S (t), יחד עם חציון ורבעי זמן ההישרדות. לא ניתן לחשב נתונים סטטיסטיים תיאוריים ישירות מהנתונים עקב צנזורה, שממעיטה בערך זמן ההישרדות האמיתי אצל נבדקים מצונזרים, מה שמוביל לאומדנים מוטים של התיאורים הממוצעים, החציוניים ואחרים. גישות שאינן פרמטריות משמשות לרוב כצעד הראשון בניתוח ליצירת סטטיסטיקה תיאורית חסרת פניות, ולעתים קרובות משתמשים בהן בשילוב עם גישות חצי פרמטריות או פרמטריות.

אומדן קפלן-מאייר

הגישה הלא-פרמטרית הנפוצה ביותר בספרות היא אומדן קפלן-מאייר (או מגבלת המוצר). אומדן קפלן-מאייר עובד על ידי פירוק האומדן של S (t) לסדרת צעדים / מרווחים על בסיס זמני האירועים שנצפו. תצפיות תורמות לאמידה של S (t) עד להתרחשות האירוע או עד לצנזורם. עבור כל מרווח מחושבת ההסתברות לשרוד עד סוף המרווח, בהתחשב בכך שנבדקים נמצאים בסיכון בתחילת המרווח (בדרך כלל מציינים את זה כ- pj = (nj - dj) / nj). אומדן S (t) לכל ערך של t שווה לתוצר של הישרדות כל מרווח עד זמן t כולל. ההנחות העיקריות של שיטה זו, בנוסף לצנזורה שאינה אינפורמטיבית, היא כי הצנזורה מתרחשת לאחר כישלונות וכי אין השפעה עוקבת על הישרדות, כך שלנבדקים יש אותה הסתברות הישרדותית ללא קשר למועד בו הם נחקרו.

ניתן לתכנן את ה- S (t) משיטת קפלן-מאייר כפונקציה שלבי עם הזמן על ציר ה- X. עלילה זו היא דרך נחמדה לדמיין את חוויית ההישרדות של העוקבה, ואפשר להשתמש בה גם כדי לאמוד את החציון (כאשר S (t) ≤0.5) או את רבעי זמן ההישרדות. ניתן לחשב נתונים סטטיסטיים תיאוריים אלה ישירות באמצעות אומדן קפלן-מאייר. מרווחי סמך 95% (CI) עבור S (t) נשענים על טרנספורמציות של S (t) כדי להבטיח שה- 95% CI נמצא בטווח של 0 ו- 1. השיטה הנפוצה ביותר בספרות היא אומדן גרינווד.

מעריך טבלת חיים

אומדן טבלת החיים של פונקציית ההישרדות הוא אחת הדוגמאות המוקדמות ביותר לשיטות סטטיסטיות יישומיות, ששימשה במשך למעלה ממאה שנים לתיאור התמותה באוכלוסיות גדולות. אומדן טבלת החיים דומה לשיטת קפלן-מאייר, אלא שמרווחים מבוססים על זמן קלנדרי במקום על אירועים שנצפו. מכיוון ששיטות טבלת החיים מבוססות על מרווחי לוח שנה אלה, ולא על סמך זמני אירוע / צנזורה בודדים, שיטות אלה משתמשות בגודל קבוע הסיכון הממוצע למרווח כדי לאמוד את S (t) ועליהן להניח כי הצנזורה התרחשה באופן אחיד לאורך מרווח הזמן של לוח השנה. מסיבה זו, אומדן טבלת החיים אינו מדויק כמו אומדן קפלן-מאייר, אך התוצאות יהיו דומות בדגימות גדולות מאוד.

אומדן נלסון-אלן

אלטרנטיבה נוספת לקפלן-מאייר היא אומדן נלסון-אלן, המבוסס על שימוש בגישה של תהליך ספירה כדי לאמוד את פונקציית הסיכון המצטבר, H (t). לאחר מכן ניתן להשתמש באומדן H (t) להערכת S (t). האומדנים של S (t) הנגזרים בשיטה זו יהיו תמיד גדולים מהערכת K-M, אך ההבדל יהיה קטן בין שתי השיטות בדגימות גדולות.

האם ניתן להשתמש בגישות שאינן פרמטריות לניתוחים בלתי משתנים או רב משתנים?

ניתן להשתמש בגישות שאינן פרמטריות כמו אומדן קפלן-מאייר לניתוח בלתי משתנה לגורמים מעניינים. הגורמים חייבים להיות קטגוריים (או באופיים או במשתנה רציף המחולק לקטגוריות) מכיוון שפונקציית ההישרדות, S (t), נאמדת עבור כל רמה של המשתנה הקטגורי ואז משווים אותם בין קבוצות אלה. ניתן לתכנן את הערכות ה- S (t) עבור כל קבוצה ולהשוות אותן באופן חזותי.

ניתן להשתמש במבחנים מבוססי דרגה גם כדי לבדוק סטטיסטית את ההבדל בין עקומות ההישרדות. בדיקות אלו משוות בין מספר האירועים הנצפים והצפויים בכל נקודת זמן בין קבוצות, בהשערת האפס כי פונקציות ההישרדות שוות בין הקבוצות. ישנן מספר גרסאות למבחנים המבוססים על דירוג זה, אשר נבדלים במשקל הניתן לכל נקודת זמן בחישוב נתוני המבחן. שתיים מהבדיקות הנפוצות ביותר המבוססות על דרגות הנראות בספרות הן מבחן דרגת היומן, אשר נותן לכל נקודת זמן משקל שווה, ומבחן וילקוקסון, המשקלל כל נקודת זמן במספר הנבדקים בסיכון. בהתבסס על משקל זה, מבחן Wilcoxon רגיש יותר להבדלים בין העקומות בתחילת המעקב, כאשר יותר נבדקים נמצאים בסיכון. בבדיקות אחרות, כמו מבחן Peto-Prentice, משתמשים במשקלים בין אלה של דרגת היומן לבין מבחני Wilcoxon. מבחנים מבוססי דרגה כפופים להנחה נוספת לפיה צנזורה אינה תלויה בקבוצה, וכולם מוגבלים במעט כוח לזהות הבדלים בין קבוצות כאשר עקומות ההישרדות עוברות. למרות שבדיקות אלו מספקות ערך p של ההבדל בין העקומות, לא ניתן להשתמש בהן כדי לאמוד את גדלי ההשפעה (לעומת זאת ערך ה- p מבחן דירוג שווה ערך ל- p עבור גורם קטגורי של עניין בקוקס שאינו משתנה. דֶגֶם).

מודלים שאינם פרמטריים מוגבלים בכך שהם אינם מספקים אומדני השפעה ובדרך כלל לא ניתן להשתמש בהם להערכת ההשפעה של גורמי עניין רבים (מודלים משתנים). מסיבה זו, לעתים קרובות משתמשים בגישות שאינן פרמטריות בשילוב עם מודלים פרמטריים למחצה או במלואם באפידמיולוגיה, כאשר בדרך כלל משתמשים במודלים מרובי משתנים לשליטה על מבולבלים.

האם ניתן לכוונן את קימורי קפלן-מאייר?

זהו מיתוס נפוץ שלא ניתן לכוונן את עקומות קפלן-מאייר, ולעתים קרובות מצוטטת זו סיבה להשתמש במודל פרמטרי שיכול ליצור עקומות הישרדות מותאמות משתנה. שיטה פותחה, עם זאת, ליצור עקומות הישרדות מותאמות באמצעות שקלול הסתברות הפוך (IPW). במקרה של משתנה אחד בלבד, ניתן לאמוד IPWs באופן לא פרמטרי והם שווים לתקינה ישירה של עקומות ההישרדות לאוכלוסיית המחקר. במקרה של מספר משתנים משתנים, יש להשתמש במודלים חצי או פרמטריים לחלוטין כדי לאמוד את המשקולות, המשמשים לאחר מכן ליצירת עקומות הישרדות מותאמות מרובות משתנים. יתרונותיה של שיטה זו הם שהיא אינה כפופה להנחת הסכנות הפרופורציונאלית, ניתן להשתמש בה עבור משתנים המשתנים בזמן, והיא יכולה לשמש גם עבור משתנים מתמשכים.

מדוע אנו זקוקים לגישות פרמטריות לניתוח נתוני זמן לאירוע?

גישה לא פרמטרית לניתוח נתוני TTE משמשת לתאר בפשטות את נתוני ההישרדות ביחס לגורם הנחקר. מודלים המשתמשים בגישה זו מכונים גם מודלים בלתי ניתנים לשינוי. באופן שכיח יותר, החוקרים מתעניינים ביחסים בין כמה משתנים ובזמן לאירוע. השימוש במודלים חצי-פרמטריים לחלוטין מאפשר לנתח את זמן האירוע ביחס לגורמים רבים בו זמנית, ומספק הערכות על חוזק ההשפעה עבור כל גורם מכונן.

מהי גישה חצי פרמטרית ומדוע משתמשים בה כל כך?

מודל ה- Cox Proportional הוא הגישה הרב-משתנית הנפוצה ביותר לניתוח נתוני הישרדות במחקר רפואי. זהו בעצם מודל רגרסיה בזמן לאירוע, המתאר את הקשר בין שכיחות האירוע, כפי שהיא באה לידי ביטוי על ידי פונקציית הסיכון, לבין קבוצת משתנים. מודל קוקס כתוב כדלקמן:

פונקציית סכנה, h (t) = h0 (t) exp {β1X1 + β2X2 + ... + βpXp}

זה נחשב לגישה חצי פרמטרית מכיוון שהמודל מכיל רכיב לא פרמטרי ורכיב פרמטרי. המרכיב הלא פרמטרי הוא הסכנה הבסיסית, h0 (t). זהו ערך המפגע כאשר כל המשתנים המשתנים שווים ל- 0, מה שמדגיש את החשיבות של מרכז המשתנים במודל לפרשנות. אל תבלבל בין הסיכון הבסיסי לסכנה בזמן 0. פונקציית הסיכון הבסיסית נאמדת באופן לא פרמטרי, ולכן בניגוד לרוב המודלים הסטטיסטיים האחרים, זמני ההישרדות אינם משוערים להתפלגות סטטיסטית מסוימת וצורת הבסיס. סכנה היא שרירותית. אין צורך לאמוד את פונקציית הסיכון הבסיסית על מנת להסיק לגבי הסכנה היחסית או יחס הסיכון. תכונה זו הופכת את מודל קוקס לחזק יותר מגישות פרמטריות מכיוון שהוא אינו חשוף למפרט שגוי של הסיכון הבסיסי.

המרכיב הפרמטרי מורכב מווקטור המשתנים. הווקטור המשתני מכפיל את הסכנה הבסיסית באותה כמות ללא קשר לזמן, כך שההשפעה של כל משתנה משתנה זהה בכל עת במהלך המעקב, וזה הבסיס להנחת הסכנות היחסי.

מהי הנחת הסכנות היחסי?

הנחת הסכנות היחסי היא חיונית לשימוש ובפרשנות של מודל קוקס.

על פי הנחה זו, קיים קשר מתמיד בין התוצאה או המשתנה התלוי לווקטור המשתנה. ההשלכות של הנחה זו הן שתפקודי המפגע עבור שני אנשים כלשהם הם פרופורציונליים בכל נקודת זמן ויחס המפגע אינו משתנה עם הזמן. במילים אחרות, אם לאדם יש סיכון למוות בנקודת זמן ראשונית כלשהי שגובהה כפול מזה של אדם אחר, הרי שבכל נקודת זמן מאוחרות יותר, הסיכון למוות נשאר גבוה כפליים. הנחה זו מרמזת כי עקומות המפגע עבור הקבוצות צריכות להיות פרופורציונליות ולא צריכות לעבור. מכיוון שההנחה הזו כל כך חשובה, בהחלט צריך לבדוק אותה.

כיצד בודקים את הנחת הסכנות היחסי?

ישנן מגוון טכניקות, הן גרפיות והן מבוססות-מבחן, להערכת תקפות הנחת הסכנות הפרופורציונליות. טכניקה אחת היא פשוט לשרטט עקומות הישרדות קפלן-מאייר אם אתה משווה שתי קבוצות ללא משתנים. אם הקימורים חוצים, הנחת הסכנות הפרופורציונאלית עשויה להיות מופרת. יש לזכור סייג חשוב לגישה זו למחקרים קטנים. עשויה להיות כמות גדולה של שגיאות הקשורות לאמידת עקומות ההישרדות במחקרים עם גודל מדגם קטן, ולכן העקומות עשויות לעבור גם כאשר מתקיימת הנחת הסכנות היחסי. עלילת הלוג-לוג המשלימה היא מבחן חזק יותר המתווה את הלוגריתם של הלוגריתם השלילי של פונקציית השורד המשוערת מול הלוגריתם של זמן ההישרדות. אם הסכנות פרופורציונליות בין קבוצות, עלילה זו תניב עקומות מקבילות. שיטה נפוצה נוספת לבדיקת הנחת הסכנות הפרופורציונאלית היא לכלול מונח של אינטראקציה בזמן כדי לקבוע אם משאבי אנוש משתנים לאורך זמן, מכיוון שהזמן הוא לרוב האשם לאי מידתיות של הסכנות. עדות לכך שמונח האינטראקציה בזמן * בקבוצה אינו אפס הם עדות כנגד סכנות מידתיות.

מה אם הנחת הסכנות היחסי לא מתקיימת?

אם אתה מגלה שהנחת ה- PH לא מתקיימת, אתה לא בהכרח צריך לנטוש את השימוש במודל Cox. ישנן אפשרויות לשיפור האי-מידתיות במודל. לדוגמה, אתה יכול לכלול במודל משתנים אחרים במודל, או משתנים חדשים, מונחים לא ליניאריים עבור משתנים קיימים, או אינטראקציות בין משתנים. לחלופין, אתה יכול לדרג את הניתוח על משתנה אחד או יותר. זה מעריך מודל שבו מותר לסכן הבסיסי להיות שונה בכל שכבה, אך ההשפעות המשתנות משתוות על פני שכבות. אפשרויות אחרות כוללות חלוקת זמן לקטגוריות ושימוש במשתני אינדיקטור כדי לאפשר ליחסי סכנה להשתנות לאורך זמן, ושינוי משתנה זמן הניתוח (למשל, מהזמן שעבר לגיל או להיפך).

איך בוחנים התאמה של מודל חצי פרמטרי?

בנוסף לבדיקת הפרות של הנחת המידתיות, יש לבחון היבטים אחרים של התאמה למודל. ניתן ליישם נתונים סטטיסטיים דומים לאלה המשמשים ברגרסיה לינארית ולוגיסטית לביצוע משימות אלה עבור מודלים של קוקס עם הבדלים מסוימים, אך הרעיונות המהותיים זהים בכל שלוש ההגדרות. חשוב לבדוק את הליניאריות של הווקטור המשתנה, שניתן לעשות זאת על ידי בחינת השאריות, בדיוק כפי שאנו עושים ברגרסיה ליניארית. עם זאת, שאריות בנתוני TTE אינן פשוטות בדיוק כמו ברגרסיה ליניארית, בין היתר מכיוון שערך התוצאה אינו ידוע בחלק מהנתונים, והשאריות לעיתים קרובות מוטות. כמה סוגים שונים של שאריות פותחו על מנת להעריך את התאמת המודל של קוקס לנתוני TTE. דוגמאות לכך כוללות את מרטינגייל ושוינפלד, בין היתר. אתה יכול גם להסתכל על השאריות כדי לזהות תצפיות משפיעות מאוד ומתאימות גרוע. ישנן גם בדיקות טובות-התאמה הספציפיות למודלים של קוקס, כמו למשל מבחן גרונסבי ובורגן ומדד התחזית של הוסמר ולמשו. אתה יכול גם להשתמש ב- AIC כדי להשוות בין דגמים שונים, אם כי השימוש ב- R2 הוא בעייתי.

מדוע להשתמש בגישה פרמטרית?

אחד היתרונות העיקריים של מודלים חצי פרמטריים הוא שאין צורך לפרט את הסיכון הבסיסי בכדי לאמוד את יחסי הסיכון המתארים הבדלים בסיכון היחסי בין קבוצות. יתכן, עם זאת, האומדן של הסיכון הבסיסי עצמו מעניין. במקרה זה, יש צורך בגישה פרמטרית. בגישות פרמטריות, מוגדרת הן פונקציית הסיכון והן השפעתם של המשתנים המשתנים. פונקציית הסיכון נאמדת על פי התפלגות משוערת באוכלוסייה הבסיסית.

היתרונות בשימוש בגישה פרמטרית לניתוח הישרדות הם:

  • גישות פרמטריות אינפורמטיביות יותר מגישות שאינן וחצי פרמטריות. בנוסף לחישוב אומדני ההשפעה היחסית, ניתן להשתמש בהם גם לחיזוי זמן ההישרדות, שיעורי הסיכון וזמני ההישרדות הממוצעים והחציוניים. ניתן להשתמש בהם גם כדי לחזות סיכון מוחלט לאורך זמן ולתכנן עקומות הישרדות מותאמות משתנה.

  • כאשר הצורה הפרמטרית מוגדרת כהלכה, למודלים הפרמטריים יש יותר כוח מאשר למודלים חצי פרמטריים. הם גם יעילים יותר, מה שמוביל לשגיאות תקן קטנות יותר ולאומדנים מדויקים יותר.

  • גישות פרמטריות מסתמכות על הסבירות המקסימלית המלאה לאמוד פרמטרים.

  • שאריות של מודלים פרמטריים לובשות את הצורה המוכרת של ההבדל שנצפה לעומת צפוי.

החיסרון העיקרי בשימוש בגישה פרמטרית הוא שהוא מסתמך על ההנחה כי חלוקת האוכלוסייה הבסיסית צוינה כהלכה. מודלים פרמטרים אינם חסונים למפרט שגוי, ולכן מודלים למחצה פרמטריים שכיחים יותר בספרות ופחות מסכנים לשימוש כאשר קיימת אי ודאות לגבי התפלגות האוכלוסייה הבסיסית.

איזו מהדברים הבאים אינה אחת הדוגמאות לנתונים בעייתיים?

איך בוחרים את הטופס הפרמטרי?

הבחירה בצורה הפרמטרית המתאימה היא החלק הקשה ביותר בניתוח ההישרדות הפרמטרי. המפרט של הצורה הפרמטרית צריך להיות מונע על ידי השערת המחקר, יחד עם ידע מוקדם וסבירות ביולוגית של צורת הסיכון הבסיסי. לדוגמא, אם ידוע כי הסיכון למוות עולה באופן דרמטי מיד לאחר הניתוח ואז יורד ומשתטח, לא יהיה זה מתאים לציין את ההתפלגות האקספוננציאלית, אשר מניחה סכנה מתמדת לאורך זמן. ניתן להשתמש בנתונים כדי להעריך אם נראה כי הטופס שצוין תואם את הנתונים, אך שיטות מבוססות נתונים אלה צריכות להשלים, ולא להחליף, את הבחירות המונעות על ידי השערה.

מה ההבדל בין מודל מפגעים פרופורציונליים לבין מודל זמן כישלון מואץ?

למרות שמודל הסכנות הפרופורציונאליות של קוקס הוא חצי פרמטרי, מודלים של מפגעים פרופורציונליים יכולים להיות גם פרמטריים. ניתן לכתוב מודלים של סכנות פרופורציונליות פרמטריות כ:

h (t, X) = h0 (t) exp (Xi β) = h0 (t) λ

כאשר הסכנה הבסיסית, h0 (t), תלויה רק ​​בזמן, t, אך לא ב- X, ו- λ היא פונקציה ספציפית ליחידות של משתנים משתנים, שאינה תלויה ב- t, שמגדילה את פונקציית הסיכון הבסיסית למעלה או למטה. λ לא יכול להיות שלילי. במודל זה, שיעור הסיכון הוא פונקציה מכפלת של הסיכון הבסיסי וניתן לפרש את יחסי הסיכון באותו אופן כמו במודל הסכנות הפרופורציונליות למחצה הפרמטרית.

מודלים של זמן כישלון מואץ (AFT) הם סוג של מודלים של הישרדות פרמטרית הניתנים ליניארית על ידי לקיחת היומן הטבעי של מודל זמן ההישרדות. הדוגמה הפשוטה ביותר למודל AFT היא המודל האקספוננציאלי, שנכתב כ:

ln (T) = β0 + β1X1 + .... + βpXp + ε *

ההבדל העיקרי בין מודלים של AFT למודלים של PH הוא שמודלים של AFT מניחים שההשפעות של המשתנים המשותפים הם מכופלים בסולם הזמן, ואילו מודלים של Cox משתמשים בסולם המפגע כפי שמוצג לעיל. הערכות פרמטרים ממודלים של AFT מתפרשות כהשפעות על סולם הזמן, שיכולות להאיץ או להאט את זמן ההישרדות. Exp (β)> 1 ממודל AFT פירושו שהגורם מאיץ את זמן ההישרדות, או מוביל להישרדות ארוכה יותר. Exp (β)<1 decelerates survival time (shorter survival). AFT models assume that estimated time ratios are constant across the time scale. A time ratio of 2, for example, can be interpreted as the median time to death in group 1 is double the median time to death in group 2 (indicated longer survival for group 1).

ניתן לכתוב ולפרש הפצות שגיאות מסוימות גם כמודלים של PH וגם של AFT (כלומר אקספוננציאלי, Weibull), אחרים הם רק PH (כלומר Gompertz) או רק מודלים של AFT (כלומר, לוג-לוגיסטי) ואחרים אינם מודלים של PH או AFT. (כלומר התאמת חוט).

אילו צורות יכולים מודלים פרמטריים להניח?

פונקציית הסיכון יכולה להתקיים בכל צורה שהיא כל עוד h (t)> 0 לכל הערכים של t. בעוד שהשיקול העיקרי לצורה הפרמטרית צריך להיות ידע מוקדם על צורת הסיכון הבסיסי, לכל תפוצה יתרונות וחסרונות משלה. חלק מהצורות הנפוצות יותר יוסברו בקצרה, עם מידע נוסף זמין ברשימת המשאבים.

הפצה מעריכית

ההתפלגות האקספוננציאלית מניחה כי h (t) תלוי רק במקדמי המודל ובמשתנים המשותפים והוא קבוע לאורך זמן. היתרון העיקרי של מודל זה הוא שהוא גם מודל סכנות פרופורציונאלי וגם מודל זמן כישלון מואץ, כך שניתן לפרש את אומדני ההשפעה כיחסי סכנה או יחסי זמן. החיסרון העיקרי של מודל זה הוא שלעתים קרובות לא מתקבל על הדעת לקחת סכנה מתמדת לאורך זמן.

הפצת וויבול

התפלגות Weibull דומה להפצה מעריכית. בעוד שההתפלגות האקספוננציאלית מניחה סכנה מתמדת, התפלגות Weibull מניחה סכנה מונוטונית שיכולה להיות גוברת או פוחתת אך לא את שניהם. יש לו שני פרמטרים. פרמטר הצורה (σ) שולט אם הסכנה עולה (σ1) (בהתפלגות האקספוננציאלית, פרמטר זה מוגדר ל- 1). פרמטר הסולם, (1 / σ) exp (-β0 / σ), קובע את סולם העלייה / ירידה הזו. מכיוון שהתפלגות ה- Weibull מפשטת להתפלגות האקספוננציאלית כאשר σ = 1, ניתן לבדוק את השערת האפס ש- σ = 1 באמצעות מבחן Wald. היתרון העיקרי של מודל זה הוא שהוא גם מודל PH וגם AFT, כך שניתן לאמוד את יחסי הסיכון וגם את יחסי הזמן. שוב, החיסרון העיקרי הוא שההנחה של מונוטוניות של הסכנה הבסיסית עשויה להיות בלתי סבירה במקרים מסוימים.

הפצת גומפרץ

התפלגות Gompertz היא מודל PH השווה להתפלגות log-Weibull, ולכן היומן של פונקציית הסיכון הוא ליניארי ב- t. להפצה זו יש שיעור כישלונות עולה באופן אקספוננציאלי, ולעתים קרובות היא מתאימה לנתונים אקטואריים, מכיוון שהסיכון לתמותה גם עולה באופן אקספוננציאלי עם הזמן.

הפצה לוגית-לוגיסטית

ההתפלגות הלוגיסטית היא מודל AFT עם מונח שגיאה העוקב אחר ההתפלגות הלוגיסטית הסטנדרטית. זה יכול להתאים לסכנות שאינן מונוטוניות, ובדרך כלל מתאים ביותר כאשר הסכנה הבסיסית עולה לשיאה ואז נופלת, מה שעלול להיות סביר למחלות מסוימות כמו שחפת. ההתפלגות הלוגית-לוגיסטית אינה מודל PH, אך זהו מודל סיכויים פרופורציונלי. פירוש הדבר שהוא כפוף להנחת הסיכויים הפרופורציונליים, אך היתרון הוא שמקדמי שיפוע יכולים להתפרש כיחסי זמן וגם כיחסי סיכוי. יחס סיכויים של 2 ממודל לוגי-לוגיסטי פרמטרי, למשל, יתפרש כסיכויי ההישרדות מעבר לזמן t בקרב נבדקים עם x = 1 הם פי שניים מהסיכויים בקרב נבדקים עם x = 0.

הפצת גמא כללית (GG)

התפלגות הגמא הכללית (GG) היא למעשה משפחה של התפלגויות המכילה כמעט את כל ההפצות הנפוצות ביותר, כולל התפלגויות אקספוננציאליות, Weibull, log normal ו- gamma. זה מאפשר השוואה בין ההפצות השונות. משפחת ה- GG כוללת גם את כל ארבעת הסוגים הנפוצים ביותר של פונקציות סכנה, מה שהופך את חלוקת ה- GG לשימושית במיוחד מכיוון שצורת פונקציית המפגע עשויה לסייע במיטוב בחירת המודל.

גישת Splines

מכיוון שהמגבלה הכללית היחידה של מפרט פונקציית הסיכון הבסיסית היא ש- (t)> 0 לכל הערכים של t, ניתן להשתמש בזריחים לגמישות מרבית בתכנון צורת הסיכון הבסיסי. פסי קוביות מוגבלים הם שיטה שהומלצה לאחרונה בספרות לניתוח הישרדות פרמטרי מכיוון ששיטה זו מאפשרת גמישות בצורה, אך מגבילה את הפונקציה להיות לינארית בקצוות שבהם הנתונים דלילים. ניתן להשתמש בקווים כדי לשפר את ההערכה והם גם יתרון לאקסטרפולציה, מכיוון שהם מתאימים למקסימום את הנתונים שנצפו. אם מצוין כראוי, אומדני האפקט ממודלים המתאימים לשימוש בקווים לא צריכים להיות מוטים. בדומה לניתוחי רגרסיה אחרים, אתגרים בהתאמות יכולות לכלול בחירת מספר ומיקום הקשרים ובעיות עם התאמת יתר.

כיצד בוחנים התאמה של מודל פרמטרי?

המרכיב החשוב ביותר בהערכת התאמת המודל הפרמטרי הוא לבדוק האם הנתונים תומכים בצורה הפרמטרית שצוינה. ניתן להעריך זאת באופן חזותי על ידי תרשים הסכנה המצטברת מבוססת המודל כנגד פונקציית הסיכון המצטבר המוערך של קפלן-מאייר. אם הטופס שצוין נכון, הגרף צריך לעבור דרך המקור בשיפוע של 1. ניתן להשתמש במבחן טובת הכושר של גרוננסבי-בורגן גם האם מספר האירועים שנצפה שונה באופן משמעותי ממספר האירועים הצפוי בקבוצות המובחנות על ידי ציוני סיכון. מבחן זה רגיש מאוד למספר הקבוצות שנבחרו, ונוטה לדחות את השערת האפס של התאמה נאותה באופן חופשי מדי אם נבחרות קבוצות רבות, במיוחד בערכות נתונים קטנות. למבחן אין כוח לזהות הפרות מודלים, אולם אם נבחרות מעט מדי קבוצות. מסיבה זו, נראה כי לא מומלץ להסתמך על מבחן כשירות לבדו כדי לקבוע אם הצורה הפרמטרית שצוינה סבירה.

ניתן להשתמש ב- AIC גם להשוואת דגמים המופעלים עם צורות פרמטריות שונות, כאשר ה- AIC הנמוך ביותר מעיד על ההתאמה הטובה ביותר. לא ניתן להשתמש ב- AIC להשוואת מודלים פרמטריים וחצי פרמטריים, אולם מכיוון שמודלים פרמטריים מבוססים על זמני אירועים נצפים ומודלים חצי פרמטריים מבוססים על סדר זמני האירועים. שוב, יש להשתמש בכלים אלה כדי לבחון האם הטופס שצוין מתאים לנתונים, אך סבירות הסיכון הבסיסי שצוין היא עדיין ההיבט החשוב ביותר בבחירת טופס פרמטרי.

לאחר שנקבעה הטופס הפרמטרי שצוין להתאים היטב לנתונים, ניתן להשתמש בשיטות דומות לאלו שתוארו בעבר למודלים של סכנה חצי פרופורציונאלית לבחירה בין דגמים שונים, כגון מגרשים שיוריים ובדיקות טובות-התאמה.

מה אם מנבאים משתנים עם הזמן?

בהצהרות המודל שנכתבו לעיל, הנחנו כי החשיפות קבועות במהלך המעקב. ניתן לכלול חשיפות עם ערכים המשתנים לאורך זמן, או משתנים משתנים בזמן, במודלים של הישרדות על ידי שינוי יחידת הניתוח מהאדם לפרק הזמן בו החשיפה קבועה. זה מפרק את זמן האדם של אנשים למרווחים שכל אדם תורם למערך הסיכון של חשוף ובלתי חשוף לאותו משתנה משתנה. ההנחה העיקרית של הכללת משתנה משתנה בזמן באופן זה היא שההשפעה של המשתנה המשתנה בזמן אינה תלויה בזמן.

עבור מודל סיכון פרופורציונלי של Cox, הכללת משתנה משתנה המשתנה בזמן תופיע בצורה של: h (t) = h0 (t) e ^ β1x1 (t). משתנים משתנים בזמן יכולים להיכלל גם במודלים פרמטריים, אם כי זה קצת יותר מסובך וקשה לפרשנות. מודלים פרמטריים יכולים גם לדגמן משתנים משתנים בזמן באמצעות סדנים לגמישות רבה יותר.

באופן כללי יש להשתמש במשתנים משתנים בזמן כאשר ההשערה היא שהסכנה תלויה יותר בערכים המאוחרים של המשתנה מאשר בערך המשתנה במתחם. באתגרים המתעוררים עם משתנים משתנים בזמן חסרים נתונים על המשתנה בנקודות זמן שונות, והטיה פוטנציאלית להערכת הסיכון אם המשתנה המשתנה בזמן הוא למעשה מתווך.

מהי ניתוח סיכונים מתחרים?

שיטות ניתוח הישרדות מסורתיות מניחות שרק סוג אחד של אירוע מעניין מתרחש. עם זאת, קיימות שיטות מתקדמות יותר המאפשרות חקירה של כמה סוגים של אירועים באותו מחקר, כגון מוות מסיבות מרובות. ניתוח סיכונים מתחרים משמש למחקרים אלה בהם משך ההישרדות מסתיים על ידי האירועים הראשונים מתוך כמה. יש צורך בשיטות מיוחדות מכיוון שניתוח הזמן לכל אירוע בנפרד יכול להיות מוטה. באופן ספציפי בהקשר זה, שיטת KM נוטה להעריך יתר על המידה את שיעור הנבדקים שחווים אירועים. ניתוח סיכונים מתחרה משתמש בשיטת ההיארעות המצטברת, בה ההסתברות הכוללת לאירוע בכל עת היא סכום ההסתברויות הספציפיות לאירוע. המודלים מיושמים בדרך כלל על ידי כניסה לכל משתתף במחקר מספר פעמים - אחד לכל סוג אירוע. עבור כל משתתף במחקר, הזמן לאירוע כלשהו צונזר בזמן בו חווה המטופל את האירוע הראשון. למידע נוסף, עיין בעמוד advancedepidemiology.org באתר סיכונים מתחרים .

מהם מודלים קלושים ומדוע הם שימושיים לנתונים מתואמים?

נתוני הישרדות מתואמים יכולים להתעורר עקב אירועים חוזרים שחווה אדם או כאשר תצפיות מקובצות לקבוצות. בין אם בגלל חוסר ידע או היתכנות, ייתכן שלא נמדד כמה משתנים שקשורים לאירוע של עניין. מודלים קלושים מסבירים את ההטרוגניות הנגרמת על ידי משתנים ללא-מדידה על ידי הוספת תופעות אקראיות, הפועלות באופן מרובה על פונקציית הסיכון. מודלים קלושים הם בעצם הרחבות של מודל קוקס בתוספת אפקטים אקראיים. למרות שקיימות תוכניות סיווג שונות ונקודות מינור המשמשות לתיאור מודלים אלה, ארבעה סוגים נפוצים של דגמי חולשה כוללים חולשה משותפת, מקוננת, משותפת ותוסף.

האם ישנן גישות אחרות לניתוח נתוני אירועים חוזרים?

נתוני אירועים חוזרים מתואמים מכיוון שמספר אירועים עשויים להתרחש באותו נושא. בעוד שמודלים קלושים הם שיטה אחת לחשבון מתאם זה בניתוחי אירועים חוזרים, גישה פשוטה יותר שיכולה להסביר מתאם זה היא השימוש בשגיאות תקן חזקות (SE). בתוספת SEs חזקות, ניתוח אירועים חוזרים יכול להיעשות כהרחבה פשוטה של ​​מודלים חצי פרמטריים או פרמטרים.

למרות שהם פשוטים ליישום, ישנן מספר דרכים למודל נתוני אירועים חוזרים באמצעות SEs חזקים. גישות אלה נבדלות באופן שבו הן מגדירות את הסיכון שנקבע לכל הישנות. באופן זה הם עונים על שאלות לימוד שונות במקצת, ולכן הבחירה באיזו גישת דוגמנות להשתמש צריכה להתבסס על השערת המחקר ותקפותן של הנחות המודל.

גישת תהליך הספירה, או אנדרסן-גיל, למידול אירועים חוזרים מניח שכל הישנות הינה אירוע עצמאי, ואינה מתחשבת בסדר או בסוג האירוע. במודל זה זמן המעקב לכל נושא מתחיל בתחילת המחקר ומתפרק למקטעים המוגדרים על ידי אירועים (הישנות). הנבדקים תורמים לסיכון שנקבע לאירוע כל עוד הם נמצאים בתצפית באותו זמן (לא מצונזר). מודלים אלה פשוטים להתאמה כמודל קוקס עם תוספת של אומדן SE חזק, ויחס הסיכון מתפרש כהשפעת המשתנה המשותפת על קצב ההישנות לאורך תקופת המעקב. מודל זה לא יהיה מתאים אם כי הנחת העצמאות אינה סבירה.

גישות מותנות מניחות כי נושא אינו נמצא בסיכון לאירוע עוקב עד שמתרחש אירוע קודם, ומכאן לקחת בחשבון את סדר האירועים. הם מתאימים באמצעות מודל מרובד, עם מספר האירוע (או מספר ההישנות, במקרה זה), כמשתנה שכבה וכולל SEs חזקים. ישנן שתי גישות מותנות שונות המשתמשות במאזני זמן שונים, ומכאן יש מערכי סיכון שונים. גישת ההסתברות המותנית מנצלת את הזמן מתחילת המחקר כדי להגדיר את מרווחי הזמן, והיא מתאימה כאשר העניין הוא במלואו של תהליך האירוע החוזר. גישת זמן הפער מאפסת למעשה את השעון לכל הישנות באמצעות הזמן שחלף מאז האירוע הקודם כדי להגדיר מרווחי זמן, והיא מתאימה יותר כאשר אומדני השפעה ספציפיים לאירוע (או הישנות) הם מעניינים.

לבסוף, גישות שוליות (המכונה גם הגישה WLW - Wei, Lin and Weissfeld - גישה) רואות כל אירוע כתהליך נפרד, ולכן הנבדקים נמצאים בסיכון לכל האירועים מתחילת המעקב, ללא קשר לשאלה האם הם חוו אירוע קודם. מודל זה מתאים כאשר חושבים שהאירועים נובעים מתהליכים בסיסיים שונים, כך שנבדק יוכל לחוות אירוע שלישי, למשל, מבלי לחוות את הראשון. למרות שההנחה הזו נראית בלתי סבירה עם סוגים מסוימים של נתונים, כמו הישנות סרטן, ניתן להשתמש בה למודל של הישנות פציעות על פני תקופת זמן, כאשר הנבדקים יכולים לחוות סוגים שונים של פציעות לאורך פרק הזמן שאין להם סדר טבעי. ניתן להתאים מודלים שוליים גם באמצעות מודלים מרובדים עם SEs חזקים.

קריאות

פרויקט זה נועד לתאר את ההחלטות המתודולוגיות והניתוחיות העומדות בפניהם כשעובדים עם נתוני זמן לאירוע, אך הוא אינו ממצה בשום פנים ואופן. להלן משאבים כדי להעמיק בנושאים אלה.

ספרי לימוד ופרקים

ויטינגוף E, Glidden DV, Shiboski SC, McCulloch CE (2012). שיטות רגרסיה בביוסטטיסטיקה, ניו יורק השנייה, ניו יורק: ספרינגר.

  • טקסט מבוא למודלים ליניאריים, לוגיסטיים, הישרדותיים ומדידות חוזרות ונשנות, הטוב ביותר למי שרוצה נקודת התחלה בסיסית.

  • פרק ניתוח ההישרדות מספק סקירה טובה אך לא עומק. הדוגמאות מבוססות STATA.

Hosmer DW, Lemeshow S, May S. (2008) ניתוח הישרדות יישומי: מודל רגרסיה של נתוני זמן לאירוע, מהדורה שנייה. הובוקן, ניו ג'רזי: ג'ון ווילי ובניו, בע'מ

  • סקירה מעמיקה של דגמי קוקס שאינם פרמטריים, חצי פרמטרים ופרמטרים, הטובים ביותר לאלה הבקיאים בתחומי סטטיסטיקה אחרים. טכניקות מתקדמות אינן מכוסות לעומק, אך ניתנות הפניות לספרי לימוד מיוחדים אחרים.

קליינבאום DG, קליין M (2012). ניתוח הישרדות: טקסט למידה עצמית, מהדורה ג '. ניו יורק, ניו יורק: ספרינגר מדע + מדיה עסקית, LLC

  • טקסט מבוא מצוין

קליין JP, Moeschberger ML (2005). ניתוח הישרדות: טכניקות לנתונים מצונזרים וקצוצים, מהדורה שניה. ניו יורק, ניו יורק: ספרינגר מדע + מדיה עסקית, LLC

  • מיועד לסטודנטים לתארים מתקדמים, ספר זה מספק דוגמאות מעשיות רבות

Therneau TM, Grambsch ראש הממשלה (2000). דוגמנות נתוני הישרדות: הרחבת מודל קוקס. ניו יורק, ניו יורק: ספרינגר מדע + מדיה עסקית, LLC

  • מבוא טוב לגישת תהליך הספירה וניתוח נתוני הישרדות בקורלציה. המחבר כתב גם את חבילת ההישרדות ב- R

אליסון PD (2010). ניתוח הישרדות באמצעות SAS: מדריך תרגול, מהדורה שניה. Cary, NC: מכון SAS

  • טקסט יישומי נהדר עבור משתמשי SAS

Bagdonavicius V, Nikulin M (2002). דגמי חיים מואצים: דוגמנות וניתוח סטטיסטי. בוקה רטון, פלורידה: צ'פמן והול / הוצאת CRC.

  • משאב טוב למידע נוסף על מודלים של זמן כשל מואץ פרמטרי וחצי פרמטרי וכיצד הם משתווים למודלים של סכנה פרופורציונאלית

מאמרים מתודולוגיים

מאמרי היכרות / סקירה כללית

Hougaard P (1999). יסודות נתוני ההישרדות. ביומטריה 55 (1): 13-22. PMID: 11318147 .

קלארק TG, ברדבורן MJ, Love SB, אלטמן DG (2003). ניתוח הישרדות חלק א ': מושגי יסוד וניתוחים ראשונים. Br J סרטן 89 (2): 232-8. PMID: 12865907

קלארק TG, ברדבורן MJ, אהבה SB, אלטמן DG (2003). ניתוח הישרדות חלק II: ניתוח נתונים רב משתני - מבוא למושגים ושיטות. Br J סרטן 89 (3): 431-6. PMID: 1288808

קלארק TG, ברדבורן MJ, Love SB, אלטמן DG (2003). ניתוח הישרדות חלק ב ': ניתוח נתונים רב משתני - בחירת מודל והערכת התאמתו והתאמתו. Br J סרטן 89 (4): 605-11. PMID: 12951864

קלארק TG, ברדבורן MJ, אהבה SB, אלטמן DG (2003). ניתוח הישרדות חלק ד ': מושגים ושיטות נוספות בניתוח ההישרדות. Br J סרטן 89 (5): 781-6. PMID: 12942105

  • הסדרה של ארבעת המאמרים לעיל היא סקירה מקדימה מצוינת של שיטות בניתוח הישרדותי כתובות היטב וקלות להבנה - היא מומלצת בחום.

גיל כסולם הזמן

Korn EL, Graubard BI, Midthune D (1997). ניתוח זמן לאירוע של מעקב אורכי של סקר: בחירת סולם הזמן. Am J Epidemiol 145 (1): 72-80. PMID: 8982025

  • מאמר הדוגל בשימוש בגיל כסולם הזמן ולא בזמן הלימוד.

אינגרם DD, Makuc DM, פלדמן JJ (1997). Re: ניתוח זמן לאירוע של מעקב אורכי של סקר: בחירת סולם הזמן. Am J אפידמיול 146 (6): 528-9. PMID: 9290515 .

  • התייחסו לעיתון Korn המתארים אמצעי זהירות שיש לנקוט כאשר משתמשים בגיל כסקף הזמן.

Thiébaut AC, Bénichou J (2004). בחירת סולם הזמן בניתוח המודל של קוקס את נתוני הקוהורט האפידמיולוגיים: מחקר סימולציה. סטט מד 30; 23 (24): 3803-20. PMID: 15580597

  • מחקר סימולציה המראה את גודל ההטיה לדרגות קשר שונות בין הגיל לבין משתנה העניין כאשר משתמשים בזמן במחקר כסולם הזמן.

Canchola AJ, Stewart SL, Bernstein L, et al. רגרסיה של קוקס תוך שימוש במאזני זמן שונים. זמין ב: http://www.lexjansen.com/wuss/2003/DataAnalysis/i-cox_time_scales.pdf .

  • מאמר נחמד המשווה בין 5 מודלים של רגרסיה של קוקס עם וריאציות בזמן הלימוד או בגיל כמדד הזמן עם קוד SAS.

צנזורה

הואנג CY, Ning J, Qin J (2015). מסקנת סבירות חצי פרמטרית לנתונים קטומים משמאל ומצונזרת ימנית. ביוסטטיסטיקה [epub] PMID: 25796430 .

  • למאמר זה מבוא יפה לניתוח נתונים מצונזרים ומספק הליך הערכה חדש להתפלגות זמן ההישרדות עם נתונים קטועים שמאליים ומצונזרים ימינה. הוא צפוף מאוד ובעל מיקוד סטטיסטי מתקדם.

קין KC, הארלו SD, ליטל RJ, נאן ב ', יוסף M, טאפה JR, אליוט MR (2011). הטיה עקב קטיעת שמאל וצנזור שמאל במחקרים אורכיים על תהליכי התפתחות ומחלות. Am J Epidemiol 173 (9): 1078-84. PMID: 21422059 .

  • משאב מצוין שמסביר את ההטיה הטמונה בנתונים מצונזרים שמאל מנקודת מבט אפידמיולוגית.

Sun J, Sun L, Zhu C (2007). בדיקת מודל הסיכויים הפרופורציונליים לנתונים מצונזרים מרווחים. נתוני חיים אנאלי 13: 37-50. PMID 17160547 .

  • מאמר נוסף צפוף סטטיסטית על היבט ניואנסי של ניתוח נתוני TTE, אך מספק הסבר טוב לנתונים מצונזרים מרווחים.

Robins JM (1995a) שיטה אנליטית לניסויים אקראיים עם צנזורה אינפורמטיבית: חלק א 'נתוני חיים אנאלי 1: 241-254. PMID 9385104 .

Robins JM (1995b) שיטה אנליטית לניסויים אקראיים עם צנזורה אינפורמטיבית: חלק II. נתוני חיים אנאלי 1: 417-434. PMID 9385113 .

  • שני מאמרים הדנים בשיטות להתמודדות עם צנזורה אינפורמטיבית.

שיטות הישרדות לא פרמטריות

בורגן Ø (2005) אומדן קפלן-מאייר. אנציקלופדיה לביוסטטיסטיקה DOI: 10.1002 / 0470011815.b2a11042

  • סקירה מעולה של אומדן קפלן-מאייר ויחסו לאומדן נלסון-אלן

רודריגז ג'י (2005). אומדן לא פרמטרי במודלים של הישרדות. זמין מ: http://data.princeton.edu/pop509/NonParametricSurvival.pdf

  • מבוא לשיטות לא פרמטריות ולמודל הסיכון הפרופורציונלי של Cox המסביר את הקשר בין שיטות לנוסחאות המתמטיות

קול SR, הרנן MA (2004). עקומות הישרדות מותאמות עם משקולות הסתברות הפוכות. תוכניות מחשוב תוכניות ביומד 75 (1): 35-9. PMID: 15158046

  • מתאר את השימוש ב- IPW ליצירת עקומות קפלן-מאייר מותאמות. כולל דוגמה ומאקרו SAS.

ג'אנג M (2015). שיטות חזקות לשיפור היעילות ולהפחתת הטיה בהערכת עקומות ההישרדות בניסויים קליניים אקראיים. נתוני חיים אנאלי 21 (1): 119-37. PMID: 24522498

  • שיטה מוצעת לעקומות הישרדות מותאמות משתנה ב- RCT

שיטות הישרדות חצי פרמטריות

קוקס DR (1972) מודלים רגרסיים וטבלאות חיים (עם דיון). J R Statist Soc B 34: 187-220.

  • ההתייחסות הקלאסית.

כריסטנסן E (1987) ניתוח הישרדות רב משתני תוך שימוש במודל הרגרסיה של קוקס. הפטולוגיה 7: 1346–1358. PMID 3679094 .

  • מתאר את השימוש במודל קוקס באמצעות דוגמה מניעה. סקירה מצוינת של היבטי המפתח בניתוח מודל קוקס, כולל אופן התאמת מודל קוקס ובדיקת הנחות המודל.

Grambsch PM, Therneau TM (1994) בדיקות סיכונים פרופורציונליות ואבחון מבוסס על שאריות משוקללות. ביומטריקה 81: 515–526.

  • מאמר מעמיק על בדיקת הנחת הסכנות היחסי. שילוב טוב של תיאוריה והסבר סטטיסטי מתקדם.

נג'אנדו NH (1997) השוואה אמפירית של מבחנים סטטיסטיים להערכת הנחת הסכנות הפרופורציונליות של המודל של קוקס. סטט מד 16: 611–626. PMID 9131751 .

  • מאמר מעמיק נוסף לבדיקת הנחת הסכנות הפרופורציונלית, זה כולל דיון בבדיקת שאריות והשפעות של צנזורה.

שיטות הישרדות פרמטריות

רודריגז, G (2010). דגמי הישרדות פרמטריים. זמין מ: http://data.princeton.edu/pop509/ParametricSurvival.pdf

  • מבוא קצר להפצות הנפוצות ביותר המשמשות לניתוח הישרדות פרמטרי

נרדי A, Schemper M (2003). השוואת קוקס ומודלים פרמטריים במחקרים קליניים. סטט מד 22 (23): 2597-610. PMID: 14652863

  • מספק דוגמאות טובות להשוואת מודלים חצי פרמטריים למודלים המשתמשים בהפצות פרמטריות נפוצות ומתמקד בהערכת התאמת המודל

רויסטון P, חברת פרמאר (2002). מפגעים פרמטריים-פרופורציונליים גמישים ומודלים של סיכויים פרופורציונליים לנתוני הישרדות מצונזרים, תוך יישום מודלים פרוגנוסטיים והערכת השפעות הטיפול סטט מד 21 (15): 2175-97. PMID: 12210632

  • הסבר טוב לבסיסי מפגעים פרופורציונליים ומודלים של סיכויים והשוואות עם זווית מעוקבת

קוקס C, צ'ו ה ', שניידר MF, Muñoz A (2007). ניתוח הישרדות פרמטרי וטקסונומיה של פונקציות סכנה להתפלגות הגמא הכללית. סטטיסטיקה מד 26: 4352-4374. PMID 17342754 .

  • מספק סקירה מצוינת של שיטות ההישרדות הפרמטריות, כולל טקסונומיה של פונקציות הסיכון ודיון מעמיק על משפחת חלוקת הגמא הכללית.

Crowther MJ, Lambert PC (2014). מסגרת כללית לניתוח הישרדות פרמטרי. סטט מד 33 (30): 5280-97. PMID: 25220693

  • מתאר הנחות מגבילות של התפלגויות פרמטריות נפוצות ומסביר מתודולוגיה מוגבלת של שורת קוב

Sparling YH, Younes N, Lachin JM, Bautista OM (2006). מודלים של הישרדות פרמטרית לנתונים מצונזרים מרווחים עם משתנים תלויי זמן. ביומטריה 7 (4): 599-614. PMID: 16597670

  • הרחבה ודוגמה כיצד להשתמש במודלים פרמטריים עם נתונים מצונזרים מרווחים

משתנים משתנים בזמן

פישר LD, לין די (1999). משתנים תלויי זמן במודל הרגרסיה של Cox. Annu Rev בריאות הציבור 20: 145-57. PMID: 10352854

  • הסבר יסודי וקל להבנה של משתנים משתנים בזמן במודלים של קוקס, עם נספח מתמטי

פיטרסן טי (1986). התאמת מודלים של הישרדות פרמטרית עם משתנים תלויי זמן. סטטיסטיקת אפליקציות 35 (3): 281-88.

  • מאמר צפוף, אך עם דוגמה שימושית שימושית

ניתוח סיכונים מתחרה

ראה סיכונים מתחרים

Tai B, Machin D, White I, Gebski V (2001) ניתוח סיכונים מתחרה של חולים עם אוסטאוסרקומה: השוואה בין ארבע גישות שונות. סטט מד 20: 661–684. PMID 11241570 .

  • מאמר מעמיק טוב המתאר ארבע שיטות שונות לניתוח נתוני סיכונים מתחרים, ומשתמש בנתונים ממחקר אקראי של חולים עם אוסטאוסרקומה כדי להשוות בין ארבע הגישות הללו.

צ'קלי W, Brower RG, Muñoz A (2010). הסקה לאירועים מתחרים בלעדיים הדדית באמצעות תערובת של התפלגויות גמא כלליות. אפידמיולוגיה 21 (4): 557–565. PMID 20502337 .

  • מאמר על סיכונים מתחרים באמצעות חלוקת הגמא הכללית.

ניתוח נתונים מקובצים ומודלים קלושים

Yamaguchi T, Ohashi Y, Matsuyama Y (2002) מודלים של סכנות פרופורציונליות עם השפעות אקראיות לבחינת השפעות מרכז בניסויים קליניים רב-מרכזיים של סרטן. שיטות Stat Med Res 11: 221-236. PMID 12094756 .

  • מאמר עם הסבר תיאורטי ומתמטי מצוין של התחשבות באשכולות בעת ניתוח נתוני הישרדות ממחקרים קליניים רב-מרכזיים.

O'Quigley J, Stare J (2002) מודלים של סכנות פרופורציונליות עם חולשות ואפקטים אקראיים. סטאט מד 21: 3219–3233. PMID 12375300 .

  • השוואה ראש בראש של מודלים קלושים ומודלים של אפקטים אקראיים.

Balakrishnan N, Peng Y (2006). מודל שברירי גמא כללי. סטטיסטיקה מד 25: 2797-2816. PMID

  • מאמר על מודלים חלשים המשתמשים בחלוקת הגמא הכללית כחלוקת השבריריות.

Rondeau V, Mazroui Y, Gonzalez JR (2012). frailtypack: חבילת R לניתוח נתוני הישרדות בקורלציה עם מודלים של חולשה באמצעות הערכת סיכויים או עונש פרמטרי. כתב העת לתוכנה סטטיסטית 47 (4): 1-28.

  • טבלת חבילת R עם מידע רקע טוב על דגמים חלשים.

Schaubel DE, Cai J (2005). ניתוח נתוני אירועים חוזרים מקובצים עם יישום שיעורי אשפוז בקרב חולי אי ספיקת כליות. ביוסטטיסטיקה 6 (3): 404-19. PMID 15831581 .

  • מאמר מצוין בו המחברים מציגים שתי שיטות לניתוח נתוני אירועים חוזרים מקובצים, ואז הם משווים תוצאות מהמודלים המוצעים לאלו המבוססים על מודל שברירי.

Gharibvand L, Liu L (2009). ניתוח נתוני הישרדות עם אירועים מקובצים. SAS Forum Forum 2009 מאמר 237-2009.

  • מקור תמציתי וקל להבנה לניתוח נתוני זמן עד אירוע עם אירועים מקובצים עם נהלי SAS.

ניתוח אירועים חוזרים

Twisk JW, Smidt N, de Vente W (2005). ניתוח יישומי של אירועים חוזרים: סקירה מעשית. J Epidemiol Health Community 59 (8): 706-10. PMID: 16020650

  • קל מאוד להבין מבוא למודל אירועים חוזרים ולמושג ערכות סיכונים

Villegas R, Juliá O, Ocaña J (2013). מחקר אמפירי של זמני הישרדות בקורלציה לאירועים חוזרים עם שולי סכנה פרופורציונליים והשפעת המתאם והצנזורה. BMC Med Res Methodol 13:95. PMID: 23883000

קלי PJ, Lim LL (2000). ניתוח הישרדות לנתוני אירועים חוזרים: יישום למחלות זיהומיות בילדות. סטט מד 19 (1): 13-33. PMID: 10623190

  • דוגמאות יישומיות לארבע הגישות העיקריות למידול נתוני אירועים חוזרים

We LJ, Lin DY, Weissfeld L (1989). ניתוח רגרסיה של נתוני זמן כשל רב-משתניים חלקיים על ידי דוגמנות התפלגויות שוליות. כתב העת של האגודה הסטטיסטית האמריקאית 84 (108): 1065-1073

המאמר המקורי המתאר מודלים שוליים לניתוח אירועים חוזרים

קורסים

מכון קיץ לאפידמיולוגיה ובריאות האוכלוסין באוניברסיטת קולומביה (EPIC)

אופקים סטטיסטיים, ספק פרטי של סמינרים סטטיסטיים מיוחדים שמועברים על ידי מומחים בתחום

  • סמינר בן 5 ימים בנושא היסטוריית אירועים וניתוח הישרדות שהוצע ב-15-19 ביולי 2015 בפילדלפיה, בהנחיית פול אליסון. אין צורך בידע קודם בניתוח הישרדות. למידע נוסף ראה http://statisticalhorizons.com/seminars/public-seminars/eventhistory13

קונסורציום בין-אוניברסיטאי למחקר פוליטי וחברתי (ICPSR) תוכנית קיץ בשיטות כמותיות של מחקר חברתי, חלק מהמכון למחקר חברתי באוניברסיטת מישיגן

  • סמינר בן שלושה ימים בנושא ניתוח הישרדות, דוגמת היסטוריית אירועים וניתוח משך שהוצע ב- 22-24 ביוני 2015 בברקלי, קליפורניה, בהוראת טנקו ריקוב מאוניברסיטת מישיגן. סקירה מקיפה של שיטות הישרדות בתחומים שונים (לא רק בריאות הציבור): http://www.icpsr.umich.edu/icpsrweb/sumprog/courses/0200

המכון לחקר סטטיסטיקה מציע שני קורסים מקוונים לניתוח הישרדות, המוצעים מספר פעמים בשנה. קורסים אלה מבוססים על ספר הלימוד לניתוח יישומי מאת קליין וקלינבאום (ראה להלן) וניתן ללמוד אותם א-לה-קארט או כחלק מתכנית תעודות בסטטיסטיקה:

  • מבוא לניתוח הישרדותי, עם דגש על מודלים קוקסיים למחצה פרמטריים, על ידי דייוויד קליינבאום או מאט סטריקלנד: http://www.statistics.com/survival/

  • ניתוח הישרדות מתקדם, כולל מודלים פרמטריים, ניתוח הישנות ומודלים חלשים, שלימד מאט סטריקלנד: http://www.statistics.com/survival2/

המכון למחקר וחינוך דיגיטלי באוניברסיטת UCLA מציע את מה שהם מכנים סמינרים באמצעות אתר האינטרנט שלהם לניתוח הישרדות בתוכנות סטטיסטיות שונות. סמינרים אלה מדגימים כיצד לבצע ניתוח הישרדות יישומי, תוך התמקדות יותר בקוד מאשר בתיאוריה.

מאמרים מעניינים

בחירת העורך

GOOGLE משחררת עדכוני אבטחה לכרום ב- 14 באפריל 2021
GOOGLE משחררת עדכוני אבטחה לכרום ב- 14 באפריל 2021
מכללת המורים, אוניברסיטת קולומביה, היא בית הספר לתואר שני הראשון והגדול ביותר בארצות הברית, וגם מדורגת באופן קבוע בין טובי המדינה.
המחלקה לשיקום ורפואה רגנרטיבית
המחלקה לשיקום ורפואה רגנרטיבית
מהי דלקת מפרקים ניוונית? דלקת מפרקים ניוונית, הצורה השכיחה ביותר של דלקת פרקים, היא מחלת מפרקים ניוונית כרונית הפוגעת בעיקר במבוגרים בגיל העמידה ומבוגרים. דלקת מפרקים ניוונית מאופיינת בפירוק סחוס מפרקים. למרות שזה יכול להופיע בכל מפרק, בדרך כלל זה משפיע על הידיים, הברכיים, הירכיים או עמוד השדרה. המחלה ידועה גם בשם דלקת מפרקים ניוונית או מחלת מפרקים ניוונית.
MOOCs
MOOCs
דניס נגד ארצות הברית
דניס נגד ארצות הברית
חופש הביטוי העולמי של קולומביה מבקש לקדם את ההבנה של הנורמות והמוסדות הבינלאומיים המגנים בצורה הטובה ביותר על זרימת המידע והביטוי החופשית בקהילה גלובלית מקושרת זו עם אתגרים נפוצים גדולים להתמודד איתם. כדי להשיג את משימתה, חופש הביטוי הגלובלי מתחייב ומזמין פרויקטים של מחקר ומדיניות, מארגן אירועים וכנסים, ומשתתף בתורמים לוויכוחים עולמיים בנושא הגנה על חופש הביטוי והמידע במאה ה -21.
כיצד אנו מגדירים נורמות עולמיות לחופש ביטוי?
כיצד אנו מגדירים נורמות עולמיות לחופש ביטוי?
ספר חדש מאת הנשיא לי סי בולינגר ואגנס קלמרד בוחן כיצד מוגדרים ושומרים על חופש הדיבור ברחבי העולם.
בית הספר למנהל עסקים בקולומביה
בית הספר למנהל עסקים בקולומביה
היה במרכז הבריאות העולמי עם תואר שני במנהל עסקים במנהל עסקים. תוכנית הבריאות והניהול התרופתי שלנו מציידת את התלמידים להיות מנהיגים מעוגלים ומוכנים להתמודד עם המורכבות הגוברת של תחום הבריאות.
מדוע סטודנטים סינים מתערבבים רק עם עצמם?
מדוע סטודנטים סינים מתערבבים רק עם עצמם?
מאת אנאבל ליו אני מעריך כל חברה אמריקאית מקומית שמוכנה לדבר איתי. לא כל מי שאני פוגש בעיר ניו יורק רוצה לדבר איתי, ואת