• English
    • Persian
    • English
    • Persian
  • English 
    • English
    • Persian
    • English
    • Persian
  • Login
View Item 
  •   KR-TBZMED Home
  • School of Health and Nutrition
  • Theses(HN)
  • View Item
  •   KR-TBZMED Home
  • School of Health and Nutrition
  • Theses(HN)
  • View Item
JavaScript is disabled for your browser. Some features of this site may not work without it.

مقایسه رویکردهای انقباضی و یادگیری ماشین در انتخاب متغیر و پیش بینی در تحلیل داده های زیستی

Thumbnail
View/Open
پایان نامه نسخه نهایی.pdf (9.949Mb)
Date
1401
Author
حمیدی, فرزانه
Metadata
Show full item record
Abstract
خلاصه فارسی مقدمه: تشخیص زودهنگام سرطان تخمدان و ژن‌های موثر در آن نقش بسیار کلیدی در درمان و حیات بیمار ایفا می‌کند. با استفاده ازداده‌های بیان ژن استخراج شده از فناوری ریزآرایه و الگوریتم‌های یادگیری ماشین می‌توان روش‌های نوین و هوشمندی درنظام سلامت و درمان ارائه داد که با دقت بالایی قادر به تشخیص سرطان تخمدان باشند. اهداف: این مطالعه با هدف مقایسه دقت رویکردهای انقباضی و یادگیری ماشین در انتخاب متغیر و پیش¬بینی در داده‌های ریزآرایه سرطان تخمدان. روش کار: داده¬های مورد استفاده در این مطالعه از داده‌های ریزآرایه سرطان تخمدان استفاده شد که بر اساس پروفایل¬های miRNAسرمی از نمونه¬های آزمایشگاهی 4046 زن بدست آمده است. داده¬ها شامل 320 سرطان تخمدان و 2459 شاهد غیرسرطانی است و تعداد ریزآرایه‌ها¬ (متغیرهای مستقل) برابر با 2565 است. جهت انتخاب متغیرهای مهم در رویکرد یادگیری ماشین از الگوریتم های بروتا و در رویکرد انقباضی از الاستیک‌نت و لاسو استفاده شد و پس از انتخاب متغیر با استفاده از پکیج‌هایی که در ادامه ذکر شده‌اند به توسعه‌ی مدل‌های طبقه‌بند و پیش‌بینی پرداخته شد. به سبب فضای اَبَرپارامتر، از اعتبارسنجی متقابل5 لایه در مجموعه داده های آموزشی استفاده شد تا خطاهای آموزشی به حداقل برسد. در پایان با استفاده از مجموعه داده های آزمایشی داخلی واعتبارسنجی خارجی، عملکردهای پیش‌بینی مدل‌ها را بر اساس چندین معیار از جمله شاخص مساحت زیر منحنیROC، درستی، حساسیت، ویژگی، ارزش اخباری مثبت، ارزش اخباری منفی برای ارزیابی تفاوت میان مدل¬ها استفاده شد. در مرحله شبیه سازی عملکرد تجربی روش‌های انتخاب متغیر روی نمونه‌های بعد بالاوبعد پایین انجام گردید بدین منظور متغیر پاسخ از توزیع دوجمله‌ای و داده‌ها از مدل رگرسیون لجستیک تولیدشد و با استفاده از پکیجglmnetو Boruta در نرم افزار R دقت روش‌های ذکر شده بدست آمد. یافته¬ها: با استفاده ازروش‌های‌ ذکرشده مجموعه متغیر‌‌های بسیارکوچک و مهمی بدست آمد که براساس معیارهای ارزیابی، نتایج حاصل شده دارای اعتبار و ارزش قابل ملاحظه ای بودندو miRNA های بدست ‌آمده به عنوان نشانگرهای زیستی بالقوه قوی برای سرطان تخمدان شناسایی شدند. همه‌ی ریزآرایه‌ها بطور مجزا دارای سطح بیان معنی‌دار در موارد سرطانی بودند(p=0.001و ROC>90٪) و درمجموعه داده‌های اصلی (p=0.001و ROC>98٪)) و در داده‌های ارزیابی خارجی( p=0.001و ROC>95٪) بود که می‌توان گفت همه‌ی 5 مدل‌ طبقه‌بند با استفاده از این ریزارایه‌ها AUC بالا و قابل توجهی داشتند. طبق نتایج مطالعه در ابعاد بالا زمانیکه همبستگی قوی باشد بروتا بهتر از الاستیک نت وبعد ازآن لاسو عملکرد خوبی دارد در حالیکه در همبستگی های پایین عملکرد الاستیک نت بهتر از بروتا ولاسو می‌باشد. نتیجه‌گیری: یافته‌های این مطالعه شواهد قابل‌توجهی مبنی بر مجموعه استخراجی از پروفایل miRNA سرمی زیست‌نشانگرهای تشخیصی امیدوارکننده‌ای برای سرطان تخمدان ارائه کرد. فاز شبیه سازی مطالعه در اکثر سناریوهای انجام گرفته نشان داد، براساس شرایطی مانند میزان همبستگی بالا و ابعاد بالا بروتا عملکرد مطلوب‌تری نسبت به الاستیک‌نت و لاسو دارد.
URI
http://dspace.tbzmed.ac.ir:80/xmlui/handle/123456789/66834
Collections
  • Theses(HN)

Knowledge repository of Tabriz University of Medical Sciences using DSpace software copyright © 2018  HTMLMAP
Contact Us | Send Feedback
Theme by 
Atmire NV
 

 

Browse

All of KR-TBZMEDCommunities & CollectionsBy Issue DateAuthorsTitlesSubjectsThis CollectionBy Issue DateAuthorsTitlesSubjects

My Account

LoginRegister

Knowledge repository of Tabriz University of Medical Sciences using DSpace software copyright © 2018  HTMLMAP
Contact Us | Send Feedback
Theme by 
Atmire NV