خوشه¬بندی داده¬های مکانی¬-زمانی براساس مدل آمیخته و کاربرد آن در تحلیل آلاینده¬های هوای ثبت شده در ایستگاه¬های پایش کیفیت هوای
Abstract
مقدمه و هدف: آلودگی هوا به¬عنوان یکی از ابعاد آلودگی محیط زیست دارای اثرات سوء بر جوامع انسانی می¬باشد. پایش کیفی هوا، اعتبارسنجی و تحلیل داده¬های پایش شده جهت بررسی کیفیت هوا و اثرات آن بر سلامت از اهمیت خاصی برخوردار است. عدم توجه به بعد مکان و زمان در داده¬های مربوط به غلظت آلاینده¬ها، موجب پایین بودن اعتبار نتایج بهدستآمده در روشهای مرسوم خوشه¬بندی می¬شود. این مطالعه با هدف استفاده از روش جدید خوشه¬بندی مبتنی بر مدل آمیخته با در نظر گرفتن ابعاد مکانی و زمانی(STM) برای تحلیل داده¬های آلودگی هوا و مقایسه کارایی آن با روش¬های خوشه¬بندی مبتنی بر مدل آمیخته با در نظر گرفتن فقط بعد زمان(TM) و بدون در نظر گرفتن ابعاد مکانی و زمانی(MCLUST) در آلاینده¬های O3 و PM10 در سال¬های ۱۳۹۶-۱۳۹۵ استان آذربایجان شرقی، شهر تبریز انجام گرفت.
مواد و روش¬ها: این مطالعه از نوع روش¬شناختی است که در آن از دادههای آلودگی هوای (آلاینده¬های O3 و PM10) ثبت شده توسط اداره کل حفاظت از محیط زیست آذربایجان شرقی، شهر تبریز در طی سال¬های ۱۳۹۶-۱۳۹۵ استفاده شد. در مرحله تحلیل، در داده¬های ساعتی آلاینده¬ها مقادیر اشتباه حذف شده و مقادیر دورافتاده براساس مقدار z-score از مطالعه کنار گذاشته شد. برای مقابله با مشکل مقادیر گمشده چندین رویکرد جانهی در نظر گرفته شد. در ادامه تحلیل، مختصات جغرافیایی ایستگاه-ها¬ و ساعت و روز ثبت میزان غلظت آلاینده¬ها به¬عنوان بعد مکانی و زمانی وارد مدل خوشه¬بندی STM، TM شد. سپس برای هر مدل¬ شاخص¬های نیکویی برازش محاسبه و با یکدیگر مقایسه شد. در نهایت خوشه¬های به دست آمده از مدل با برازش بهتر از نظر ارتباط با پارامترهای هواشناسی با استفاده از ضریب همبستگی من-کندال در سطح معنی¬داری ۰۵/۰ و ۰۱/۰ درصد تجزیه و تحلیل شد. تمامی تجزیه و تحلیلها در محیط نرمافزار R نسخه ۴.۰.۲ انجام شد.
یافته¬ها: در مقایسه روش¬های جانهی، روش درون¬یابی خطی بهتر از بقیه روش¬ها بود، لذا داده¬های گمشده بااستفاده از این روش جانهی و سری داده¬ بدون مقدار گمشده وارد تحلیل خوشه¬بندی شد. از نظر قدرمطلق BIC در هر دو آلاینده بالاترین مقدار مربوط به روش MCLUST و پایین¬ترین مقدار برای روش STM بود. تعداد خوشه¬های آلاینده O3 و PM10برای روش STM به ترتیب 3 و 4، روش TM ۴ و ۵ و در روش MCLUST برابر با ۹ و ۹ بود. در هر دو آلاینده تعداد خوشه¬های روش STM کمترین بود. ارتباط آلاینده¬ها با دما در خوشه¬های بدست آمده از روش STM در آلاینده O3، در تمامی خوشه¬ها مثبت و معنی-دار، در آلاینده PM10، در برخی خوشه¬ها مثبت و معنی¬دار و در ارتباط با رطوبت نسبی و بارش باران در هر دو آلاینده منفی و معنی¬دار در سطح معنی¬داری ۰۵/۰ و ۰۱/۰ بود. خوشه چهارم PM10 بیشترین میانگین غلظت و میانگین دما و کمترین میزان بارش، و در مقابل آن خوشه سوم کمترین میانگین غلظت را داشت. خوشه دوم O3 کمترین میانگین غلظت و میانگین دما و کمترین میزان وزش باد، و در مقابل آن خوشه سوم بیشترین میانگین غلظت را داشت. تاثیر دما و بارش باران در مقایسه با پارامترهای دیگر در افزایش و کاهش آلاینده¬ها بالاتر بود.
نتیجه¬گیری: طبق نتایج این مطالعه، مدل STM برای داده¬هایی که دارای ابعاد مکانی و زمانی با حجم بالا هستند، دقت و سرعت بالاتری در تجزیه و تحلیل داده¬ها در مقایسه با روش¬های مرسوم دیگر دارد. در این روش، هر دو بعد مکان و زمان به صورت همزمان وارد مدل می¬شود و نیازی به بررسی جداگانه غلظت آلاینده¬ها در زمان¬ و مکان مختلف نیست، لذا حجم نتایج مورد بررسی کاهش و میزان خطا در تصمیم¬گیری¬ها کم¬تر می¬شود. طبق بررسی نتایج، الگوی قرارگیری روزها در خوشه¬ها به¬گونه-ای بود که روزهای گرم سال با میزان بارش و رطوبت نسبی پایین در یک خوشه، روزهای سرد سال با دمای پایین در یک خوشه، روزهایی با بارش بالا در خوشه دیگر قرار گرفته¬اند. براساس خوشه¬های به¬دست آمده پارامترهای تاثیرگذار بر غلظت آلاینده¬ها به تفکیک فصل و روز مشخص شد.
واژگان کلیدی: خوشه¬بندی، آلاينده¬هاي هوا، مدل آمیخته، داده¬های مکانی-زمانی، رویکرد جانهی، شهر تبريز