کاربرد روش وزندهی احتمال معکوس سانسورها در تحلیل بقای مبتنی بر روشهای یادگیری ماشین
Abstract
مقدمه: رویکردهای مورد استفاده در روشهای یادگیری آماری در بررسی مشاهدات از راست سانسور شده در مطالعات بقا باعث برآوردهای اریب یا پیشبینیهایی با دقت کمتر برای خطر میشوند.
هدف: هدف مطالعه حاضر، به کارگیری روش وزندهی احتمال معکوس سانسورها در روشهای یادگیری آماری شامل روشهای درخت تصمیم، نزدیکترین همسایه، مدل جمعی تعمیم یافته به منظور ارائه برآوردهای بهتری از سانسورها و پیشبینیهایی با صحت بیشتر برای دادههای سرطان پستان بود.
روش کار: دادههای مربوط به 1154 بیمار تازه تشخیص داده شده به سرطان پستان اولیه، که در فاصله اسفند 1385 تا اسفند 1394 در مرکز ثبت سرطان مبتنی بر جمعیت آذربایجان شرقی جمعآوری شده اند، مورد استفاده قرار گرفت. سه مدل یادگیری آماری با استفاده از وزندهی احتمال معکوس سانسورها برای بررسی رابطه بین رخداد مرگ با سن، جنسیت، درجه تومور، مورفولوژی و زمان بقا بررسی شد و نتایج حاصل با استفاده از شاخصهای حساسیت، ویژگی، صحت، مساحت زیر منحنی ROC، ارزش پیشگویی مثبت و ارزش پیشگویی منفی مقایسه شد.
یافتهها: در کل 217 نفر از بیماران (٪8/18) تا انتهای مطالعه مرگ به دلیل سرطان پستان را تجربه کردند. از میان مدلهای برازش شده، مدل جمعی تعمیم یافته به ترتیب با حساسیت، ویژگی و صحت (7/99و9/96) 8/98، (5/88و3/78) 9/83 و (8/94و3/90) 8/92 بهترین برازش را برای دادهها داشت. به طور کلی متغیرهای سن، درجه تومور، مورفولوژی و مدت زمان بقا در پیشبینی صحیح نقش داشتند.
بحث و نتیجهگیری: مدل جمعی تعمیمیافته با توجه به قدرت پیشبینی بالاتر، برای پیشبینی در دادههای بیماران مبتلا به سرطان پستان توصیه میشود. همچنین با توجه به اینکه ، متغیرهای سن بیمار، درجه تومور، مورفولوژی و مدت زمان بقا از جمله عوامل تاثیرگذار بر مرگ و میر ناشی از سرطان پستان بودند، توجه به این عوامل در فرآیند درمان میتواند در کاهش مرگ و میر ناشی از سرطان پستان موثر باشد.