روش های آماری برای تعیین ترکیبات بهینه از نشانگرهای زیستی و کاربرد آنها در طبقه بندی داده های پزشکی
Abstract
مقدمه: سطح زیر منحنی ROCیک معیار مرسوم برای ارزیابی عملکرد طبقه بندی نشانگرهای زیستی است. در
عمل یک نشانگر قدرت طبقه بندی محدودی دارد لذا برای بهبود عملکرد طبقه بندی، علاقمند به ترکیب
نشانگرهای زیستی به صورت خطی و غیرخطی هستیم.) RAMP AUC (RAUCیک روش مبتنی بر AUCاست
که ترکیباتی از نشانگرها را پیدا می کند. در این مطالعه، از مدل RAUCبرای یافتن ترکیب بهینه از شاخص های
مراقبتی محدودیت عملکردی، به عنوان یک عارضه دیابت مورد استفاده قرار گرفت و صحت خروجی آن بر پایه
نشانگرهای موثر، مورد بررسی قرار گرفت.
روشها: این مطالعه مقطعی بر روی 378بیمار دیابتی مراجعه کننده به مراکز دیابتی اردبیل و تبریز طی سالهای 1392
انجام شده است. برای طبقه بندی دقیق ببماران دیابتی با توجه به وضعیت محدودیت عملکردی، روش RAMPبا
هسته RBFبرای جستجوی ترکیب بهینه از شاخص های مراقبت استفاده شد. عملکرد طبقه بندی مدل توسط
AUCمورد بررسی قرار گرفت و با مدلهای رگرسیون لوجستیک، ماشین بردار پشتیبان ) (SVMو جمعی تعمیم
یافته ) (GAMبا استفاده از روش اعتبارسنجی آموزش و آزمون مورد مقایسه قرار گرفت.
یافته ها: از بین 378بیمار دیابتی، %67/46دارای محدودیت عملکردی می باشند. مقدار AUCکه از روی داده های
آزمون، برای مدل RAUCبدست آمده، برابر 1می باشد که بیشتر از مقدار بدست آمده برای مدل SVM ) و کمی بهتر ازAUC=0/76( Linear با هستهSVM،)AUC=0/82( GAM ، )AUC=0/79(لوجستیک
با هسته )AUC=0/98( RBFمی باشد.
نتیجه گیری: رابطه غیرخطی قوی بین داده ها وجود دارد که مدل RAUCبا هسته RBFکه یک ترکیب غیرخطی
از متغیرهای پیشگو می باشد این الگو را به خوبی تایید می کند