• English
    • Persian
  • English 
    • English
    • Persian
  • Login
View Item 
  •   KR-TBZMED Home
  • School of Health and Nutrition
  • Theses(HN)
  • View Item
  •   KR-TBZMED Home
  • School of Health and Nutrition
  • Theses(HN)
  • View Item
JavaScript is disabled for your browser. Some features of this site may not work without it.

استفاده از روشهای مبتنی بر کمترین مربعات جزئی در تحلیل دادههای ترافیکی و مقایسه کارایی آنها با روشهای مرسوم

Thumbnail
View/Open
Jamali Full.pdf (8.745Mb)
Date
1399
Author
جمالی دولتآباد, میلاد
Metadata
Show full item record
Abstract
مقدمه: در بررسی روابط بین متغیرها روشهای رگرسیونی بهطور گسترده در حال استفاده است. افزایش ابعاد دادهها باعث ایجاد مشکلاتی همچون هم خطی چندگانه، عدم تفسیرپذیری ضرایب متعدد و پایین بودن اعتبار نتایج بهدستآمده، در روشهای معمولی میشود. همچنین ازنظر کاربردی حوادث ترافیکی یکی از مشکلات اساسی در جهان و بهخصوص در کشور ایران است. اهداف: این مطالعه باهدف معرفی و مقایسه کارایی روشهای رگرسیونی مبتنی بر کمترین مربعات جزئی( )PLSبرای تحلیل دادههای ترافیکی و مقایسه کارایی آن با روشهای مرسوم در پیشبینی مرگومیر ناشی از حوادث ترافیکی بر اساس عوامل مربوط به عابر، وسیله، راننده، سرنشین و تصادف در دادههای حوادث ترافیکی سالهای ۱393و ۱394استانهای آذربایجان شرقی، آذربایجان غربی و اردبیل انجام گرفت. روش کار: این مطالعه از نوع مورد-شاهدی است که در آن از دادههای حوادث ترافیکی ثبتشده توسط پلیس در استانهای آذربایجان شرقی، آذربایجان غربی و اردبیل در طی سال ۱393و ۱394استفاده شد. برای توصیف متغیرهای کیفی از فراوانی و درصد و برای متغیرهای کمی از شاخصهای میانگین و انحراف معیار استفاده شد. در مرحله تحلیل، کل تصادفات منجر به فوت بهعنوان مورد و از حوادث غیر فوتی به تعداد سه برابر موردها بهصورت تصادفی بهعنوان شاهد انتخاب شد. بعد از بررسی پیشفرضهای لازم (مقادیر گمشده، مقادیر دورافتاده و همبستگی2 چندگانه)، در ادامه برای مقابله با مقادیر گمشده سه رویکرد (جایگذاری با استفاده از مدلسازی چندمتغیره ) ،(MICEجایگذاری با روش کمترین مربعات جزئی غیر خطی) (NIPALSو حذف مقادیر گمشده) در نظر گرفته شد. سپس بهمنظور پیشبینی مرگ افراد صدمهدیده با استفاده از عوامل مربوط به تصادف و ویژگیهای فرد مصدوم در سه گروه عابر، راننده و سرنشین از مدلهای اریبدار رگرسیون ،(RR) Ridgeرگرسیون ،)LR( Lassoروش مبنی بر کاهش ابعاد بدون نظارت تحلیل مؤلفه اصلی ( )PCAو دو رویکرد از روش مدلسازی نظارتشده PLS ( PLS-DAو )R-PLSاستفاده شد. همچنین بهمنظور بررسی اعتبار مدلها، 70درصد از دادهها بهعنوان مجموعه آموزش و 30درصد از دادهها بهعنوان مجموعه اعتبار در نظر گرفته شد. مدلها با استفاده از دادههای آموزش برازش داده شد و شاخصهای نیکویی برازش (حساسیت، ویژگی، مساحت زیر منحنی ROCو دقت) با استفاده از دادههای مجموعه اعتبار محاسبه شد. درنهایت نتایج مربوط به شاخصهای نیکویی برازش با استفاده از مدلهای خطی عمومی مورد مقایسه قرار گرفت. تمامی تجزیهوتحلیلهای اصلی در محیط نرمافزار Rنسخه 4.0.0و بسته های نرم .) بودندglmnet-mixOmics-mice- plsgenomics( ا نتایج: در مقایسه مدلها، میانگین مساحت زیر منحنی ROCبرای روشهای لجستیک معمولی PLS-)، روش0/778( PCA )، روش0/856( LR )، روش0/86۱( RR )، روش0/840( )0/848(DAو روش R-PLSبرابر با ( )0/839بود. بالاترین مقدار مربوط به روش LRو پایینترین مقدار مربوط به روش PCAبود. اختلاف میانگین این شاخص در مدلهای مختلف ازنظر آماری معنیدار بود ( )P= 0/040و روش PCAبهطور معنیداری شاخص مساحت زیر3 منحنی ROCپایینتری از بقیه مدلها داشت. همچنین در خصوص روشهای مختلف مقابله با مقادیر گمشده میانگین مساحت زیر منحنی ROCدر دادههای با حذف مقادیر گمشده ()0/833 جایگذاری با روش )0/842( MICEو جایگذاری با الگوریتم )0/837( NIPALSبود. بهطورکلی میانگین مساحت زیر منحنی ROCدر روشهای جایگذاری مقادیر گمشده بالاتر از روش حذف مقادیر گمشده بود ولی این اختلاف ازنظر آماری معنیدار نبود ( .)P=0/897همچنین میانگین شاخص حساسیت ( )P> 0/00۱و دقت ( )P> 0/00۱نیز در بین مدلهای مختلف تفاوت معنیدار داشتند و این شاخصها در روش PCAپایینترین میانگین را داشتند. میانگین شاخص ویژگی نیز در بین مدلهای مختلف اختلاف معنیدار با یکدیگر داشتند (.)P= 0/043 همچنین، درونشهری بودن یا برونشهری بودن حادثه، نوع جاده، کاربری محل وقوع، خودرو مورد استفاده و درگیر، نوع برخورد ازجمله عواملی بودند که در هر سه گروه از مجموعه دادهها بر شدت حادثه تأثیر مهمی داشتند. بحث و نتیجهگیری: طبق نتایج این مطالعه، کلیه مدل ها نتایج قابل قبول و تقریبا مشابه داشتند ولی بهطورکلی مدلهای نظارتشده نتایج بهتری از مدلهای بدون نظارت نشان دادند. همچنین مدلهای معرفیشده در این مطالعه ( PLS-DA ،PCA ،LR ،RRو )R-PLSدر برآورد اثر متغیرهای پیشگو بهتر عمل کرده و اثر متغیرهای کم تأثیر را نیز لحاظ میکند. بهطورکلی بر اساس نتایج این مطالعه استفاده از این روشها در مطالعات با تعداد متغیرهای پیشگو بالا و دادههای با مشکل هم خطی چندگانه توصیه میشود.4 همچنین ازنظر کاربردی نیز عواملی که در خصوص کاربری محل حادثه و موقعیت مسیر وقوع تصادف در هر سه گروه دادهها بالاترین اثر را در شدت حادثه نشان دادند، ارائه راهکارهایی در جهت ارتقاء کیفیت خدماترسانی با توجه به محل وقوع حادثه میتواند کمک بسزایی در کاهش مرگومیر ناشی از حوادث ترافیکی داشته باشد. همچنین در خصوص متغیرهایی مانند ویژگیهای خودرو، نحوه برخورد و ویژگیهای فرد صدمهدیده که در شدت حادثه تأثیرگذار بودند، انجام مداخلاتی در جهت ارتقای ایمنی وسایل نقلیه و محیط و همچنین ارتقای دانش ایمنی افراد کمک بسزایی در کاهش مرگومیر ناشی از حوادث ترافیکی داشته باشد
URI
http://dspace.tbzmed.ac.ir:8080/xmlui/handle/123456789/62173
Collections
  • Theses(HN)

Knowledge repository of Tabriz University of Medical Sciences using DSpace software copyright © 2018  HTMLMAP
Contact Us | Send Feedback
Theme by 
Atmire NV
 

 

Browse

All of KR-TBZMEDCommunities & CollectionsBy Issue DateAuthorsTitlesSubjectsThis CollectionBy Issue DateAuthorsTitlesSubjects

My Account

LoginRegister

Knowledge repository of Tabriz University of Medical Sciences using DSpace software copyright © 2018  HTMLMAP
Contact Us | Send Feedback
Theme by 
Atmire NV