dc.contributor.author | حمیدی, فرزانه | |
dc.date.accessioned | 2022-07-31T04:07:04Z | |
dc.date.available | 2022-07-31T04:07:04Z | |
dc.date.issued | 1401 | en_US |
dc.identifier.uri | http://dspace.tbzmed.ac.ir:80/xmlui/handle/123456789/66834 | |
dc.description.abstract | خلاصه فارسی
مقدمه: تشخیص زودهنگام سرطان تخمدان و ژنهای موثر در آن نقش بسیار کلیدی در درمان و حیات بیمار ایفا میکند. با استفاده ازدادههای بیان ژن استخراج شده از فناوری ریزآرایه و الگوریتمهای یادگیری ماشین میتوان روشهای نوین و هوشمندی درنظام سلامت و درمان ارائه داد که با دقت بالایی قادر به تشخیص سرطان تخمدان باشند.
اهداف: این مطالعه با هدف مقایسه دقت رویکردهای انقباضی و یادگیری ماشین در انتخاب متغیر و پیش¬بینی در دادههای ریزآرایه سرطان تخمدان.
روش کار: داده¬های مورد استفاده در این مطالعه از دادههای ریزآرایه سرطان تخمدان استفاده شد که بر اساس پروفایل¬های miRNAسرمی از نمونه¬های آزمایشگاهی 4046 زن بدست آمده است. داده¬ها شامل 320 سرطان تخمدان و 2459 شاهد غیرسرطانی است و تعداد ریزآرایهها¬ (متغیرهای مستقل) برابر با 2565 است. جهت انتخاب متغیرهای مهم در رویکرد یادگیری ماشین از الگوریتم های بروتا و در رویکرد انقباضی از الاستیکنت و لاسو استفاده شد و پس از انتخاب متغیر با استفاده از پکیجهایی که در ادامه ذکر شدهاند به توسعهی مدلهای طبقهبند و پیشبینی پرداخته شد. به سبب فضای اَبَرپارامتر، از اعتبارسنجی متقابل5 لایه در مجموعه داده های آموزشی استفاده شد تا خطاهای آموزشی به حداقل برسد. در پایان با استفاده از مجموعه داده های آزمایشی داخلی واعتبارسنجی خارجی، عملکردهای پیشبینی مدلها را بر اساس چندین معیار از جمله شاخص مساحت زیر منحنیROC، درستی، حساسیت، ویژگی، ارزش اخباری مثبت، ارزش اخباری منفی برای ارزیابی تفاوت میان مدل¬ها استفاده شد. در مرحله شبیه سازی عملکرد تجربی روشهای انتخاب متغیر روی نمونههای بعد بالاوبعد پایین انجام گردید بدین منظور متغیر پاسخ از توزیع دوجملهای و دادهها از مدل رگرسیون لجستیک تولیدشد و با استفاده از پکیجglmnetو Boruta در نرم افزار R دقت روشهای ذکر شده بدست آمد.
یافته¬ها: با استفاده ازروشهای ذکرشده مجموعه متغیرهای بسیارکوچک و مهمی بدست آمد که براساس معیارهای ارزیابی، نتایج حاصل شده دارای اعتبار و ارزش قابل ملاحظه ای بودندو miRNA های بدست آمده به عنوان نشانگرهای زیستی بالقوه قوی برای سرطان تخمدان شناسایی شدند. همهی ریزآرایهها بطور مجزا دارای سطح بیان معنیدار در موارد سرطانی بودند(p=0.001و ROC>90٪) و درمجموعه دادههای اصلی (p=0.001و ROC>98٪)) و در دادههای ارزیابی خارجی( p=0.001و ROC>95٪) بود که میتوان گفت همهی 5 مدل طبقهبند با استفاده از این ریزارایهها AUC بالا و قابل توجهی داشتند. طبق نتایج مطالعه در ابعاد بالا زمانیکه همبستگی قوی باشد بروتا بهتر از الاستیک نت وبعد ازآن لاسو عملکرد خوبی دارد در حالیکه در همبستگی های پایین عملکرد الاستیک نت بهتر از بروتا ولاسو میباشد.
نتیجهگیری: یافتههای این مطالعه شواهد قابلتوجهی مبنی بر مجموعه استخراجی از پروفایل miRNA سرمی زیستنشانگرهای تشخیصی امیدوارکنندهای برای سرطان تخمدان ارائه کرد. فاز شبیه سازی مطالعه در اکثر سناریوهای انجام گرفته نشان داد، براساس شرایطی مانند میزان همبستگی بالا و ابعاد بالا بروتا عملکرد مطلوبتری نسبت به الاستیکنت و لاسو دارد. | en_US |
dc.language.iso | fa | en_US |
dc.publisher | دانشگاه علوم پزشکی تبریز، دانشکده بهداشت | en_US |
dc.subject | سرطان تخمدان | en_US |
dc.subject | بیان ژن | en_US |
dc.subject | ریزآرایه | en_US |
dc.subject | زیستنشانگر | en_US |
dc.subject | لاسو | en_US |
dc.subject | الاستیکنت | en_US |
dc.subject | بروتا | en_US |
dc.subject | کاهش ابعاد | en_US |
dc.subject | رستهبندی | en_US |
dc.subject | انتخاب متغیر | en_US |
dc.subject | یادگیری ماشین. | en_US |
dc.title | مقایسه رویکردهای انقباضی و یادگیری ماشین در انتخاب متغیر و پیش بینی در تحلیل داده های زیستی | en_US |
dc.type | Thesis | en_US |
dc.contributor.supervisor | گیلانی, ندا | |
dc.identifier.callno | 588ب | en_US |
dc.contributor.department | آمار زیستی | en_US |
dc.description.discipline | آمار زیستی | en_US |
dc.description.degree | کارشناسی ارشد | en_US |