توسعه مدل پهنهبندی خطر شیوع سرطان معده در استان آذربایجان شرقی با استفاده از یادگیری ماشین و سیستم اطلاعات جغرافیایی
Abstract
خلاصه
مقدمه: استان آذربایجان شرقی در جایگاه دوم شیوع سرطان معده قرار دارد. علیرغم تلاشها و پیشرفتهای فناوری، هنوز هم GC بهعنوان کشندهترین سرطان شناخته میشود. ازاینرو مدلسازی این بیماری میتواند نقش مهمی در شناسایی مناطق مستعد، تشخیص زودتر بیماری، برنامهریزی و اولویتبندی داشته باشد.
هدف: این مطالعه باهدف تهیه مدل خطرپذیری GC در استان آذربایجان شرقی با استفاده از تکنیکها، عوامل محیطی، GIS و ML انجام شد.
روش کار و مواد: آدرس محل سکونت بیماران در طی سالهای 1394-1398 از برنامه ثبت سرطان مبتنی بر جمعیت استان آذربایجان شرقی دریافت شد. سپس با استفاده از نرمافزار Google Earth آدرس 2884 بیمار به مختصات جغرافیایی تبدیل و با به کارگیری GIS نقشه توزیع جغرافیایی GC به دست آمد. با مطالعه منابع مرتبط 9 پارامتر تأثیر گذار برروی GC انتخاب شد که جهت مدلسازی با LR و LMT و استخراج وزن وارد نرمافزار WEKA شدند. در نهایت نقشه پهنهبندی خطرپذیری شیوع GC در محیط نرمافزار GIS به دست آمد. برای ارزیابی عملکرد مدلها نیز از مقادیر AUC و RMSE استفاده شد.
یافتهها: نسبت ابتلا به GC در مردان 2.09 برابر زنان بود. مطابق با نقشه توزیع جغرافیایی GC، کانونهای تمرکز در مناطق مرکزی شناسایی شدند. مطابق با هر دو مدل LR و LMT، 8 شهرستان بهعنوان مناطق پرخطر و مستعد ابتلا به GC و 5 شهرستان بهعنوان مناطق کم خطر GC نشان داده شدند. در این مطالعه عملکرد پیشبینی خطرپذیری مدل LR بهتر از LMT بود.
نتیجهگیری: استفاده از مدلهای یادگیری ماشین میتواند مناطق پرخطر GC را مشخص کند و به مدیران و سیاست گزاران برای اولویتبندی و برنامهریزی امکانات تشخیصی و درمانی کمک کند. این مطالعه، اولین پژوهش انجام شده در حوزهی خطرپذیری GC است؛ بنابراین انجام تحقیقات بیشتر موردنیاز میباشد.
واژگان کلیدی: سرطان معده، پهنهبندی، سیستم اطلاعات جغرافیایی، رگرسیون لجستیک، مدل لجستیک درختی، آذربایجان شرقی، ایران