مدلسازی پیشبینیکننده دادهمحور اینده نگری مواد معدنی با استفاده از یادگیری ماشین و روشهای یادگیری عمیق: مطالعه موردی از استان جیانگشی جنوبی، چین
چکیده
مدلسازی پیشبینی آیندهنگری مواد معدنی، یک روش مهم، اما چالش برانگیز برای تعیین اهداف آیندهنگری کشفنشده در اکتشاف معدنی، با پیشرفتهای اخیر تکنیکهای مدلسازی فضایی و الگوریتمهای یادگیری ماشین تحریک شده است. در این مطالعه، مجموعهای از روشهای یادگیری ماشین، از جمله جنگل تصادفی (RF)، ماشین بردار پشتیبان (SVM)، شبکه عصبی مصنوعی (ANN)، و یک شبکه عصبی پیچیده یادگیری عمیق (CNN)، برای انجام یک مدلسازی داده آیندهنگری W در استان جیانگشی جنوبی، چین استفاده شد.
در مجموع 118 رویدادw شناخته شده به دست آمده از اکتشاف طولانی مدت این منطقه متروکه و هشت لایه شامل شواهدی از اطلاعات زمین شناسی چند منبع مرتبط با کانی سازی W ،مجموعه دادههای ورودی را تشکیل میدهند. این اطلاعات یک پایه غنی از داده برای آموزش مدلهای یادگیری ماشینی فراهم کرد. پیکربندی بهینه پارامترهای مدل با یک روش جستجوی شبکه آموزش داده شد و با اعتبارسنجی متقابل 10 برابری تأیید شد. مدلهای پیشبینیکننده بهطور جامع توسط یک ماتریس درهم ریختگی، منحنی مشخصه عملکرد گیرنده و منحنی نرخ موفقیت ارزیابی شدند.
نتایج مدلسازی نشان میدهد که مدل CNN بهترین عملکرد طبقهبندی را با دقت 92.38 درصد به دست میآورد و پس از آن مدل RF (87.62 درصد) قرار دارد. در مقابل، مدل RF از بقیه مدلهای ML در عملکرد پیشبینی کلی و کارایی پیشبینی برتری دارد. این با بیشترین مقدار مساحت زیر منحنی و تندترین شیب منحنی نرخ موفقیت مشخص میشود. مدل RF به عنوان مدل بهینه برای آینده نگری مواد معدنی در این منطقه انتخاب شد زیرا بهترین پیش بینی کننده است.
مناطق آینده نگری مشخص شده توسط نقشه چشم انداز 9 درصد از منطقه مورد مطالعه را اشغال کرده و 66.95 درصد از رخدادهای معدنی شناخته شده را به خود اختصاص داده اند. تفسیر زمینشناسی مدل نشان میدهد که انومالیهای منگنز قبلاً نادیده گرفته شده، شاخصهای مهمی هستند. این نشان میدهد که غنی سازی مواد معدنی در سنگهای میزبان ممکن است نقش مهمی در فرآیند تشکیل ولفرامیت داشته باشد و میتواند یک معیار اکتشافی نوآورانه برای اکتشاف بیشتر در این منطقه باشد.
مقدمه
مدلسازی آیندهنگری معدنی (MPM) که به عنوان نقشه برداری معدنی نیز شناخته میشود، با هدف ترسیم و اولویتبندی مناطق آینده نگر برای اکتشاف ذخایر معدنی کشف نشده از یک نوع خاص است .اساساً، مدلسازی آینده نگری فرآیند ایجاد یک تابع یکپارچهسازی است که مجموعهای از ویژگیهای زمینشناسی (متغیرهای ورودی) را با حضور ذخایر معدنی مورد نظر (متغیرهای خروجی) مرتبط میکند. این فرآیند شامل دو مرحله کلیدی است:
(الف) تولید نقشههای مشهود منطقی که نشاندهنده پروکسیهای فضایی فرآیندهای تشکیل سنگ بر اساس مدل مفهومی که از مجموعه دادههای اکتشاف از نوع کانسار و در دسترس است به دست امده است (به عنوان مثال، زمینشناسی، ژئوفیزیک، ژئوشیمیایی). و دادههای سنجش از دور) و
(ب) یکپارچهسازی و وزن دهی نقشههای مشهود با استفاده از الگوریتمهای ریاضی متنوع برای ایجاد تابعی که وقوع ذخایر معدنی را تقریب میکند. دو دسته اصلی از مدلهای MPM بر اساس تخصیص وزنهای شواهد در مرحله دوم تعریف میشوند:
- (1) مدلهای دانش محور که نقشههای مشهود را به صورت اکتشافی بر اساس دانش متخصصان وزن میکنند، و
- (2) مدلهای مبتنی بر داده که وزنهای شواهد را به صورت تجربی تعیین میکنند. در مورد رابطه فضایی بین نقشههای مشهود و ذخایر معدنی شناخته شده.
مدلهای ترکیبی با در نظر گرفتن قضاوت کارشناسان و ذخایر معدنی موجود نیز توسط برخی از محققین پیشنهاد و اعمال شده است. به طور کلی، مدلهای MPM مبتنی بر دانش برای مناطقی که کمتر کاوششده (یا حوزه بکر) انجام میشوند، مناسب هستند، جایی که MPM برای ترسیم اهداف اکتشافی جدید انجام میشود. در حالی که مدلهای MPM مبتنی بر داده برای مناطقی که به خوبی کاوش شده (یا متروکه) مناسب هستند، جایی که MPM برای ترسیم اهداف اکتشافی بیشتر اجرا میشود.
در چند دهه گذشته، انواع روشهای مدلسازی مبتنی بر داده منجر به پیشرفتهایی در زمینه MPM شده است. روشهای احتمالی مانند وزن شواهد و رگرسیون لجستیک به دلیل بیان واضح مدلها و سادگی تفسیر، محبوبیت زیادی به دست آوردهاند و الگوریتمهای پرکاربرد باقی ماندهاند. در طول دهه گذشته، روشهای یادگیری ماشین (ML) که عمدتا توسط یک دانشمند کامپیوتر برای حل مسائل چند زمینهای طبقهبندی و تشخیص الگو توسعه یافتهاند، به عنوان ابزار امیدوارکنندهای برای تولید مدلهای پیشبینیکننده آیندهنگری معدنی ظاهر شدهاند.. برخی از متداولترین روشهای یادگیری ماشینی عبارتند از:
- شبکه عصبی مصنوعی (ANN)،
- ماشین بردار پشتیبان (SVM)،
- جنگل تصادفی (RF).
بسیاری از مطالعات قبلی نشان میدهند که این روشهای ML از تکنیکهای آماری سنتی و مدلهای اکتشافی تجربی در عملکرد پیشبینی بهتر عمل میکنند، بهویژه زمانی که ویژگیهای شواهد ورودی بهطور پیچیده توزیع شدهاند و انتظار میرود ارتباط آنها با کانیسازی غیرخطی باشد. اخیراً، روشهای یادگیری عمیق، شاخهای مهم از الگوریتمهای یادگیری ماشین، در بسیاری از حوزههای علم به موفقیت زیادی دست یافتهاند. یادگیری عمیق به مدلها اجازه میدهد تا نمایشهای سلسله مراتبی دادههای ورودی را با سطوح مختلف انتزاعی بیاموزند.
بنابراین، میتواند ساختار پیچیدهای را در مجموعه دادههای هدفمند کشف کند و توانایی تشخیص و طبقهبندی الگو را تقویت کند. بسیاری از محققان این ابزار سودمند را برای مقابله با مشکلات مدلسازی مختلف، مانند نقشهبرداری استعداد زمین لغزش، نقشهبرداری ژئوشیمیایی و مدلسازی هواشناسی به حوزه علوم زمین معرفی کردهاند. با این حال، کاربردهای کمی از این روش را میتوان در حوزه MPM یافت. شایان ذکر است که اگرچه الگوریتمهای ابتکاری و قوی متعددی برای MPM پیشنهاد شده است، هیچ مدل واحدی در همه شرایط برتری ندارد. مطالعه تطبیقی مدلهای پیشبینیکننده چندگانه لزوماً در یک MPM دادهمحور کارآمد مورد نیاز است.
استان جیانگشی جنوبی یکی از مهم ترین پایگاههای تولید جهانی W است. دهها رخداد W، از جمله هشت کانسار در مقیاس بزرگ (بیش از 50000 تن)، 18 کانسار در مقیاس متوسط (10،000 50،000 تن)، و همچنین کانسارهای کوچک مقیاس متعدد (< 10،000 تن) و چشماندازها، در این منطقه کشف شدهاند. با ذخیره اثبات شده W تجمعی 1.7 Mt این منطقه نمونه خوبی از ناحیه متروکه است که دادههای زمینشناسی کافی را برای آموزش مدلهای آینده نگری فراهم میکند.
دو سهم اصلی این کار را میتوان در زیر خلاصه کرد: اول، تا جایی که ما میدانیم، این مقاله برای اولین بار مدلسازی منطقهای را در این منطقه معدنی مهم با کاربرد و مقایسه الگوریتمهای مختلف یادگیری ماشین و یادگیری عمیق بر اساس گزارش میکند. ادغام اطلاعات اکتشافی چند منبعی به طور خاص، مدل CNN یادگیری عمیق به ندرت در MPM استفاده شده است و عملکرد پیشبینی آن در این مطالعه ارزیابی شده است. دوم، برخی معیارهای اکتشافی نوآورانه توسط نتایج مدلسازی آشکار میشوند، که میتواند اکتشاف آینده را تسهیل کند و بینشهایی را در مورد مدل ژنتیکی کانیسازی تنگستن در این منطقه ارائه دهد.
زمینشناسی منطقهای و کانیسازی تنگستن
استان جیانگشی جنوبی، واقع در بخش مرکزی بلوک کاتایزیا، مربوط به بخش شرقی کمربند متالوژنیک بزرگ نانلینگ است (شکل 2). توالی رسوبی در معرض، در این منطقه شامل سنگهای آواری رخساره شیست سبز نئوپروتروزوییک، سنگهای کربناته و سیلیکاتی دریایی کمعمق پالئوزوئیک، لایههای مزوزوئیک متشکل از ماسهسنگهای آتشفشانی و ماسه سنگ سرخ اواری و پوشش سنوزوئیک (شکل 2) است. چارچوب زمین ساختی منطقه مورد مطالعه عمدتاً توسط سه سیستم گسلی کنترل میشود که به ترتیب تقریباً در شمال شرقی، شرق و غرب و شمال غربی هستند (شکل 2).
منطقه مورد مطالعه چهار دوره ماگماتیسم گرانیتی را تجربه کرده است، از جمله کالدونین (پالئوزوئیک اولیه تا میانی)، هرسینین (پالئوزوئیک پسین)، ایندوسینین (مزوزوئیک اولیه) و یانشانین (مزوزوئیک پسین) ،که منجر به نفوذهای متعدد همراه با رخنمون است. تقریباً 14000 کیلومتر مربع (شکل 2). رخنموهای گرانیتهای این منطقه عمدتاً بیوتیت مونزوگرانیت، مونزونیت و مونزوگرانیت پورفیریتی هستند. نهشتههای W پراکنده در این ناحیه تحت سلطه نوع رگه کوارتز، با مقادیر کمتری از انواع اسکارن و گریزن هستند [41]. ضخامت رگههای کانی سازی شده از چند میلیمتر تا رگههای با عرض یک متر متغیر است (شکل 1). کانی سازی W در انواع مختلف از نظر مکانی، زمانی و ژنتیکی با تودههای گرانیتی یانشانیان مرتبط است.
تمام رسوبات W در تماسهای بین توده نفوذی آذرین و سنگهای دیواره رسوبی رخ میدهد (شکل 1). مطالعات دقیق زمانی نشان میدهد که نهشتههای W در این منطقه در اواخر ژوراسیک (عمدتاً 170-150) تشکیل شدهاند و هیچ تفاوت زمانی قابل توجهی (1-6 Ma) بین سنگهای W و تودههای گرانیتی نزدیک آنها وجود ندارد. مدلهای ژنتیکی نهشتههای W در این منطقه بر رابطه نزدیک کانیسازی W و تکامل گرانیتهای یانشانی تأکید میکند.
ماگماهای گرانیتی از ذوب نسبی پوسته با ورودی مواد مافیک به دست آمدند و سپس در W با مواد فرار فراوان در قسمتهای رأسی اتاقکهای ماگما دچار تفکیک و غنیسازی قابلتوجهی شدند. هنگامی که ماگما در سطح کم عمقی قرار میگرفت، مایعات فلزی از مذابها خارج شدند. کانیسازی گرایزن، رگه کوارتز و اسکارن احتمالاً زمانی تشکیل میشود که سیالات متوالی با نفوذهای گرانیتی، آواری و سنگهای کربناته مواجه میشوند (شکل 1).
این نوع کانیسازی W متعلق به یک سیستم معدنی هیدروترمال یکپارچه است و بنابراین اجزای تشکیل دهنده کانه مانند منبع فلزی و مسیرهای سیالات را به اشتراک میگذارد. کانیسازی w را میتوان با ترکیب مشابهی از نقشههای شواهد نشاندهنده مؤلفههای فوق پیشبینی کرد. اعتقاد بر این است که سیستمهای گسلی منطقهای کنترل قابلتوجهی بر فعالیت تکتونو ماگمایی Yanshanian و کانیسازی W مرتبط اعمال میکنند. استقرار ماگمای گرانیتی مربوط به سنگ معدن توسط گسلهای عمیق، بهویژه آن دسته از گسلهای مربوط به سیستم تکتونیکی NE-NNE که در دوران یانشانی تشکیل میشود، کنترل میشود. اینها مسیرهایی را برای صعود ماگمای مرتبط با سنگ معدن فراهم کردند. گسلهای ثانویه در پوش سنگها، شبکههای انتقال سیالات فلزی را تشکیل میدادند و تقاطع این گسلها فضای قابل نفوذی را برای به دام انداختن و تمرکز سیالات فراهم میکرد.
روشها
1- جنگل تصادفی (RF)
جنگل تصادفی یک الگوریتم یادگیری گروهی است. این درختهای تصمیم چندگانه را برای پیشبینیهای مکرر پدیده نشاندادهشده توسط مجموعه داده آموزشی جمعآوری میکند. درختان تصمیم به عنوان طبقهبندیکننده پایه استفاده میشوند که «جنگل» را تشکیل میدهند. این درختان بر اساس زیر مجموعههای آموزشی متنوع تولید میشوند. یک روش نمونهگیری به نام «جمعسازی خودگردان ساز» (که به اختصار «انباشت سازی» نیز نامیده میشود) برای تولید زیرمجموعههای آموزشی با نمونهگیری تصادفی از مجموعه داده آموزشی اصلی با جایگزینی استفاده میشود (یعنی نمونههای انتخاب شده برای ایجاد یک درخت از فهرست حذف نمیشوند. مجموعه داده ورودی را میتوان دوباره برای تولید درخت بعدی انتخاب کرد).
درختان با تقسیم مکرر گرههای ریشه به گرههای برگ دوتایی رشد میکنند. چنین فرآیند تقسیم دادهها در هر گره داخلی تا رسیدن به یک شرط توقف از پیش تعیین شده تکرار میشود .بر خلاف درخت تصمیم استاندارد، زیرمجموعهای از متغیرها که بهطور تصادفی از متغیرهای پیشبینیکننده ورودی انتخاب میشوند، به عنوان شرایط متمایز در هر گره درخت در جنگل استفاده میشوند. سپس الگوریتم RF در تمام شکافها جستجو میکند تا گره بهینه را بیابد که درجه خلوص درختان حاصل را به حداکثر میرساند. خلوص اندازهگیری این است که اگر یک نمونه تصادفی انتخاب شده از مجموعه داده ورودی، به دستی برچسب گذاری میشود اگر بهطور تصادفی بر اساس توزیع برچسبها در زیر مجموعهها برچسبگذاری شود. شاخص جینی (IG) که به طور گسترده استفاده میشود در این مطالعه برای محاسبه خلوص اطلاعات گرههای برگ در مقایسه با گرههای ریشه آنها استفاده میشود که میتواند به صورت فرموله شود:
که در آن fi احتمال کلاس i در گره n است. این چنین تعریف میشود:
که در آن mj تعداد نمونههای متعلق به کلاس j است و m نشان دهنده تعداد کل نمونهها در یک گره خاص است. خروجی پیشبینی نهایی RF به رأی اکثریت همه پیشبینیهای درختهای تصمیم بستگی دارد.
سناریوهای تصادفی انتخاب نمونه و انتخاب متغیر، همبستگی بین درختان منفرد را کاهش میدهند و تنوع جنگل را افزایش میدهند، که میتواند به طور موثر استحکام الگوریتم را افزایش داده و از برازش بیش از حد جلوگیری کند.
2- ماشین بردار پشتیبانی (SVM)
ماشین بردار پشتیبانی بر اساس یادگیری آماری و به حداقل رساندن ریسک ساختاری توسعه یافته است. این الگوریتم به دنبال ایجاد طبقهبندی است که طبقات مختلف را با استفاده از وسیعترین مرزهای تصمیم جدا میکند، که با تولید یک ابر صفحه با حداکثر حاشیه به دست میاید .از آنجایی که این مطالعه بر طبقهبندی باینری (وقوع رویداد معدنی یا عدم وقوع) بر اساس ویژگیهای زمینشناسی یکپارچه که روابط غیرخطی پیچیدهای دارند، تمرکز دارد، الگوریتم SVM غیرخطی مورد استفاده برای طبقهبندی باینری استفاده میشود.
این الگوریتم در زیر توضیح داده شده است. با توجه به مجموعه داده آموزشی با n بردار پیش بینی کننده، به هر بردار یک برچسب yi اختصاص داده میشود. در این حالت، yi=1 نشان دهنده وقوع رخداد معدنی و yi=~1 نشان دهنده عدم وقوع است. دادههای ورودی ابتدا از طریق یک تابع نگاشت F به فضای H با ابعاد بالاتر نگاشت میشوند، جایی که یک ابر صفحه برای جداسازی دو کلاس میتواند با معادله زیر تولید شود
که در آن w و b بردار وزن و سوگیری ابر صفحه هستند. و i متغیر کمکی مثبت است. طبق نظریه بهینهسازی، مسئله یافتن ابر صفحه بهینه به مسئله حل معادله درجه دوم محدب زیر تبدیل میشود:
این مسئله بهینهسازی را میتوان با ساخت تابع لاگرانژ حل کرد:
که i (i = 1, 2, : : : , n) ضریب لاگرانژ است که توسط یک تابع بهینه سازی به دست میآید:
که در آن C ضریب مجازات خطای طبقهبندی اشتباه است. یک تابع هستهای K را میتوان در اینجا تعریف کرد:
برخی از توابع هستهای که معمولاً مورد استفاده قرار میگیرند عبارتند از: پایه شعاعی، خطی، چند جملهای و سیگموئید. تابع پایه شعاعی به دلیل خطاهای کم و سادگی پارامترها در کاربرد عملی در این مطالعه استفاده شد:
جایی که عرض تابع پایه شعاعی است.
3- شبکه عصبی مصنوعی (ANN)
ANN یک روش مدلسازی است که از سیستمهای عصبی بیولوژیکی الهام گرفته شده و توانایی تشخیص الگوی مغز انسان را شبیهسازی میکند. یک نورون مصنوعی واحد عملکردی است که اطلاعات دریافتی را پردازش میکند. با استفاده از یک تابع فعالسازی انجام میشود. تابع فعالسازی سیگموئید به کار رفته در این مطالعه را میتوان به صورت زیر بیان کرد:
که در آن x داده ورودی است. نورونها به طور موازی در گروهی به نام “لایه” مرتب شده اند. ANN دارای یک پیکربندی چند لایه معمولی است که از یک لایه ورودی، یک یا چند لایه پنهان و یک لایه خروجی تشکیل شده است. رایج ترین شبکه عصبی مورد استفاده، شبکه پیشرو است و در این مقاله به کار گرفته شده است. در این شبکه عصبی، نورونهای لایههای مختلف به طور کامل به یکدیگر متصل هستند، اما اطلاعات یک طرفه است که از لایه ورودی از طریق لایههای پنهان به لایه خروجی شروع میشود. انتشار اطلاعات با اختصاص وزنهای اولیه به اتصالات نورونهای مختلف انجام میشود که میتواند به صورت زیر فرموله شود:
که در آن وزنی است که نورون i در لایه قبلی را به نورون j متصل میکند، و bj عبارت بایاس نورون j است، در حالی که f تابع فعال سازی است.
روش انتشار پسرو برای افزایش قابلیت یادگیری ANN استفاده میشود. این روش خطای خروجی را بین مقدار پیشبینیشده و مقدار هدف واقعی محاسبه میکند، سپس آن را به ANN باز میگرداند، و سپس ANN وزنها و بایاسها را در شبکه تنظیم میکند تا خطای خروجی را به حداقل برساند.. میزان به روز رسانی وزن توسط نرخ یادگیری کنترل میشود. چنین فرآیندهای انتشار مجدد تا رسیدن به دقت از پیش تعیین شده یا حداکثر تعداد تکرار ،تکرار میشوند.
4- شبکه عصبی پیچشی (CNN)
CNN یک کلاس از شبکههای عصبی یادگیری عمیق است که اساساً از یک لایه ورودی، یک یا چند لایه پیچشی، لایههای ادغام و لایههای کاملاً متصل و یک لایه خروجی تشکیل شده است. دادههای ورودی که با X = (x1, x2, : : : , xn) نشان داده میشوند، ابتدا به یک لایه پیچشی داده میشوند. لایه پیچشی از یک فیلتر به طور تصادفی اولیه (که هسته نیز نامیده میشود) برای انجام یک عملیات پیچشی استفاده میکند.
شکل 3a نمونهای از پیچشی را نشان میدهد، که در آن یک فیلتر پیچشی در کل مجموعه داده ورودی جابجا میشود، و محصولات نقطهای بین ورودیهای فیلتر و دادههای ورودی محاسبه میشوند، که منجر به ایجاد یک مجموعه داده با ویژگی جدید میشود (که به عنوان یک نگاشت ویژگی شناخته میشود.استفاده از هستههای مختلف (که به عنوان Si مشخص میشود) نتایج پیچشی متعددی را تولید میکند که بر اساس آن مجموعهای از نگاشتهای ویژگی جدید برای ارائه نمایشهای متفاوتی از بردارهای ورودی به صورت سلسله مراتبی تولید میشود که میتواند به صورت زیر بیان شود:
که در آن g یک تابع فعالسازی است که برای تقویت غیرخطی نتایج کانولوشن استفاده میشود. تابع واحد خطی اصلاح شده (ReLU) متداولترین مورد استفاده در CNN است که میتواند به صورت زیر فرموله شود:
نگاشتهای ویژگی که توسط یک یا چند لایه پیچشی تولید میشوند، سپس به یک لایه ادغام ارسال میشوند. ادغام همچنین یک عملیات مبتنی بر فیلتر است که از یک فیلتر متحرک برای استخراج حداکثر (حداکثر ادغام) یا میانگین (متوسط تجمع) دادههایی که با فیلتر همپوشانی دارند، استفاده میکند، همانطور که در شکل 3b نشان داده شده است. در این مطالعه از حداکثر ادغام استفاده شده است.
لایههای ادغام برای یک فرآیند نمونهبرداری پایین برای کاهش ابعاد شبکه استفاده میشود که به کاهش هزینه محاسباتی و کنترل مشکلات اضافه برازش کمک میکند. به این ترتیب، دادههای ورودی از طریق لایههای پیچشی و ادغام متوالی برای استخراج ویژگیها منتشر میشوند. نگاشتهای ویژگی استخراج شده به چندین لایه کاملاً متصل ارسال میشود که میتواند به عنوان ANN وابسته که در بالا توضیح داده شد در نظر گرفته شود. خروجی لایههای کاملاً متصل به آخرین لایه ارسال میشود که از یک تابع فعالسازی softmax برای محاسبه احتمال پیشبینی همه کلاسها با فرمول زیر استفاده میکند:
که در آن y کلاس پیش بینی شده را نشان میدهد و w و b به ترتیب وزن و بایاس برای کلاس مربوطه هستند.
در MPM، دادههای ورودی یادگیری ماشین را میتوان به عنوان تصویر در نظر گرفت که در آن هر پیکسل نشان دهنده اندازه گیری یک ویژگی خاص است. بنابراین، هر سلول شبکه با یک بردار ستونی با طول تعیین شده توسط تعداد ویژگیهای شواهد نشان داده میشود. در این راستا، CNN با نمایش دادههای یک بعدی که دارای یک معماری معمولی نشان داده شده در شکل 4 است، در این مطالعه استفاده شد. با فرض وجود n ویژگی شواهد در مجموعه داده ورودی، یک لایه کانولوشن با استفاده از N فیلتر با اندازه (n1) منجر به N بردار ویژگی جدید با طول (m × n + 1) میشود.
سپس خروجی لایه کانولوشن با استفاده از فیلتر (a*1) یک لایه ادغام شده تنظیم میشود که در نتیجه N نگاشت ویژگی با اندازه (m – n – a + 2)*1] ایجاد میشود. پس از یک یا چند عملیات ادغام کانولوشن، نگاشتهای ویژگی خروجی به یک شبکه عصبی کاملاً متصل با نورونهای x وارد میشوند. در نهایت، آخرین لایه کاملاً متصل از یک تابع softmax برای بدست آوردن احتمال پیشبینی استفاده میکند و یک تولید باینری را به عنوان خروجی میدهد.
مجموعه دادهها و برنامه
آماده سازی دادههای ورودی (شامل متغیرهای پیش بینی کننده و هدف) اولین و یک مرحله مهم MPM است. ادغام متغیرهای پیشبینی چند منبع و تولید مجموعه دادههای ورودی با استفاده از نرمافزار ArcGIS ESRI نسخه 10.2، مؤسسه تحقیقات سیستمهای محیطی، Redlands، CA، USA اجرا شد. استفاده از مدلسازی مبتنی بر ML، شامل آموزش و ارزیابی مدل، در (استودیو RapidMiner نسخه 9.3، RapidMiner، Inc.، بوستون، MA، ایالات متحده آمریکا) انجام شد. این نرم افزار ابزارهای مدل سازی کاربردی متعددی را ارائه میدهد و منبع فراوانی از الگوریتمهای یادگیری ماشین را تعبیه میکند.
1) متغیرهای پیشبینی کننده
متغیرهای پیشبینی کننده به عنوان شرایط تعیین کننده برای پیش بینی پتانسیل معدنی استفاده میشوند. متغیرهای قابل اعتماد باید با درک سیستم معدنی W هدایت شوند.با توجه به مدل ژنتیکی و عوامل کنترل کننده کانی سازی W که در بخش 2 توضیح داده شد، و بر اساس مجموعه دادههای در دسترس عموم، ما از هشت نقشه شواهد به عنوان متغیرهای پیش بینی کننده شامل اطلاعات زمین شناسی، ژئوفیزیک و ژئوشیمیایی استفاده کردیم.
دادههای زمین شناسی از پایگاه داده آنلاین سازمان زمین شناسی چین بر اساس دههها تحقیقات منطقه ای گرفته شده است. نزدیکی به رخنمونهای یانشانی به عنوان یک نقشه شواهد که منبع سیستم تشکیل سنگ معدن را نشان میدهد به کار گرفته شد (شکل 5) a با توجه به تجزیه و تحلیل فضایی انجام شده در این منطقه ، گسلهای منطقه ای با روند NE و EW رابطه مثبتی با رخداد w نشان میدهند، در حالی که گسلهای با روند NW احتمالاً پس از کانی سازی تشکیل شده اند، و هیچ ارتباط فضایی آشکاری با وقوع کانی نشان نمیدهند.
بنابراین، نقشههای چگالی گسلهای روند NE و EW و تقاطعهای آنها به عنوان شواهدی برای نمایش کنترلهای ساختاری بر کانیسازی مورد استفاده قرار گرفت (شکل 5.(b,c آنومالیهای ژئوفیزیکی میتوانند اطلاعاتی در مورد اجسام زیرسطحی مانند سنگهای نفوذی در منطقه ارائه دهند. بنابراین، دادههای ژئوفیزیکی، از جمله گرانش و مغناطیسی، برای تشخیص وقوع سنگهای نفوذی مرتبط با سنگ معدن در عمق مورد استفاده قرار گرفتند (شکل 5). d,e آنومالیهای ژئوشیمیایی عناصر معدنی، نشانههای جهت کانسارهای مورد نظر هستند.
از آنجایی که W، منگنز و آهن مهمترین اجزای تشکیلدهنده ولفرامیت (((Fe,Mn)WO4) هستند که بر کانسنگهای این ناحیه غالب هستند، آنومالیهای ژئوشیمیایی در این عناصر استخراجشده از دادههای ژئوشیمیایی رسوب رودخانهای محدوده Nanling ، نشان داده شد که به عنوان نقشههای شواهدی استفاده میشود (شکل 5) f-h .دادهها از پروژه ملی نقشهبرداری ژئوشیمیایی چین با تراکم نمونهبرداری یک نمونه در هر کیلومتر مربع به دست آمد. W با روش قطب نگاری و منگنز و آهن با روش فلورسانس اشعه ایکس تجزیه و تحلیل شدند.
شکل 5. ویژگیهای شواهدی که به عنوان متغیرهای پیش بینی کننده برای مدل سازی آینده نگری استفاده میشوند: (الف) فاصله تا توده نفوذی. (ب) چگالی گسلهای امتدادی NE-EW. ج) تراکم تقاطعهای گسلهای امتدادی NE-EW. د) آنومالی ثقلی؛ ه) آنومالی مغناطیسی؛ (و) آنومالیW ز) آنومالی آهن. و (ح) آنومالی منگنز.
پس از تهیه نقشههای شواهد، آنها به نقشههای شطرنجی تبدیل شدند که در آن هر سلول یک نمایش عددی از ویژگیهای شواهدی دارد. اندازه سلول بر اساس یک سناریوی عینی پیشنهاد شده توسط کارانزا تعیین شد. با در نظر گرفتن کمبود مواد معدنی، شبکه سلولی باید اطمینان حاصل کند که هر سلول منفرد حاوی تنها یک رخداد معدنی باشد. تجزیه و تحلیل فاصله همسایه میتواند به ارائه یک محدوده مرجع از اندازه سلول کمک کند. فواصل بین هر رخداد شناخته شده و نزدیکترین رخداد همسایه آن محاسبه و به صورت آماری ترسیم شد (شکل 6). میتوان مشاهده کرد که حداقل فاصله هر دو نزدیکترین رخداد 490 متر است. این یک حد بالایی از اندازه سلول را تعیین میکند. حد پایین Rs اندازه سلول را میتوان با یک فرمول تجربی محاسبه کرد:
جایی که نشان دهنده مقیاس نقشه است. بزرگ ترین مقیاس نقشههای شواهد به کار رفته در این تحقیق 1:300000 است. این نشان میدهد که حد پایین اندازه سلول باید 75 متر باشد. اندازه سلول 450 متر برای تولید یک نوار شطرنجی حاوی 195174 سلول انتخاب شد. هر سلول دارای ترکیبی از هشت مقدار ویژگی است که نشان دهنده شواهد زمینشناسی، ژئوفیزیک و ژئوشیمیایی است.
2) متغیر هدف
متغیرهای هدف، از جمله وقوع مواد معدنی و مکانهای غیرقابل وقوع، به عنوان نمونههای آموزشی و اعتبارسنجی برای یک مدلسازی پیشبینی نظارت شده استفاده میشوند. وقوع مواد معدنی از پایگاه داده آنلاین سازمان زمین شناسی چین مشتق شده است. مکانهای عدم وقوع بر اساس سناریوی پیشنهادی Carranza و Zuo انتخاب شدند:
(1) مقدار نمونههای غیرقابل رخ دادن باید برابر با موارد معدنی باشد، به طوری که نسبت نمونههای مثبت و منفی باشد. در مجموعه دادههای آموزشی و اعتبارسنجی متعادل خواهد بود.
(2) مکانهای غیرقابل وقوع باید به اندازه کافی دور از هر رویداد شناخته شده باشند. مناطق نزدیک به رخدادهای معدنی موجود احتمالاً شرایط سنگسازی مشابهی دارند.
تجزیه و تحلیل فاصله همسایه رخدادهای معدنی را میتوان برای تعیین فاصله ای که فراتر از آن مکانهای غیر وقوع باید انتخاب شوند استفاده کرد (شکل 6). میتوان مشاهده کرد که حداکثر فاصله بین هر دو رخداد 26302 متر است. احتمال 100% یافتن رخداد دیگری در فاصله 26302 متری هر رخداد وجود دارد. مکانهای غیرقابل وقوع باید فراتر از محدوده 26302 متری رخدادهای معدنی انتخاب شوند.
با این حال، مکانهای کمی را میتوان در این محدوده انتخاب کرد. در عوض، 7271 متر به عنوان یک محدوده محفوظ انتخاب شد که در آن 85٪ احتمال یافتن یک رخداد همسایه در کنار هر رخداد موجود وجود دارد، و نمونههای غیرقابل رخ دادن باید خارج از مناطق تحت کنترل انتخاب شوند (شکل 7).
(3) رخدادهای معدنی در یک منطقه خاص عموماً دارای توزیع فضایی خوشه ای هستند (شکل 7)، زیرا آنها محصول رویدادهای نادر و فرآیندهای غیرتصادفی تشکیل سنگ هستند. در مقابل، مکانهای غیرقابل اتفاق باید بهطور تصادفی توزیع شوند، زیرا ناشی از فرآیندهای زمینشناسی مشترک هستند.
اگرچه معیارهای بالا که برای انتخاب مکانهای غیر تصادفی، استفاده میشوند، بر اساس دادههای آماری و توزیع رخدادهای معدنی، عینی هستند، انتخاب دستی ممکن است با توجه به ترکیبی از برخی از رخدادهای کانی پنهان، همچنان در مجموعههای دادههای غیرقابلتصادفی به عدم قطعیت منجر شود. این امر به میزان زیادی بر قابلیت اطمینان نتایج مدلسازی تأثیر میگذارد. برای کاهش اثر نمونههای منفی کاذب، سه مجموعه داده غیرقابل وقوع تولید شد.
هر یک شامل 118 نمونه غیر تصادفی است که بر اساس سناریوی تصادفی ذکر شده در بالا (شکل 7) انتخاب شدند و در نتیجه سه مجموعه داده از متغیرهای هدف به دست آمد. سپس سه مجموعه داده برچسبگذاریشده بهطور تصادفی به دو بخش تقسیم شدند، از جمله 70٪ نمونههای برچسبگذاریشده که به عنوان مجموعه داده آموزشی خدمت میکنند و نمونههای برچسبگذاریشده دیگر سپس به عنوان مجموعه داده اعتبار استفاده میشوند.
3) آموزش مدل
پس از آمادهسازی دادههای ورودی، مدلهای ML توسط فرآیندهای آموزشی تولید شدند. اینها عمدتاً شامل تعیین پارامترهای کلیدی مورد استفاده برای مدلهای ML بودند. تعیین تغییرات مناسب پیشینی پارامترها در مدلسازی مبتنی بر داده دشوار است. پارامترهای بهینه برای مدلهای ML منفرد با مجموعه دادههای ورودی خاص و پسزمینههای کاربردی مختلف متفاوت است. هیچ قاعده تجربی عمومی برای تعیین این پارامترها وجود ندارد. در این راستا، برای به دست آوردن پارامترهای بهینه، یک روش آزمون و خطا بسیار عینی همیشه مورد نیاز است.
برای انجام این روش از روش جستجوی شبکه ای استفاده شد. جدول 1 پارامترهای کلیدی ML و محدوده مرجع آنها را که توسط مطالعات قبلی پیشنهاد شده است، فهرست میکند. ترکیب احتمالی پارامترهای مورد استفاده برای آموزش مدلهای ML فردی با جستجو در محدوده مرجع مقادیر با طول گام مشخص بهدست آمد. سپس یک روش اعتبارسنجی متقاطع 10 برابری برای ارزیابی عملکرد طبقهبندی مدلهای ML آموزشدیده با استفاده از ترکیب احتمالی پارامترها اجرا شد.
در این روش، مجموعه دادههای آموزشی ورودی بهطور تصادفی به 10 زیرمجموعه با اندازه مساوی تقسیم شدند، 9 زیرمجموعه برای آموزش مدلهای پیشبینی و بقیه به عنوان مجموعه داده آزمایشی برای محاسبه خطاهای طبقهبندی استفاده شد. این روش 10 بار تکرار شد تا اینکه هر زیر مجموعه یک بار به عنوان مجموعه داده آزمایشی استفاده شد. میانگین مربعات خطا (MSE) برای ارزیابی عملکرد طبقه بندی مدلهای آموزش دیده استفاده شد. این را میتوان با فرمول زیر محاسبه کرد:
که در آن N تعداد نمونهها در مجموعه داده آزمایشی است. yˆi نتیجه پیشبینیشده هر نمونه را نشان میدهد (یعنی 1 برای وقوع معدنی و 0 برای عدم وقوع). yi مقدار واقعی هر نمونه را نشان میدهد. ترکیبی از پارامترهایی که بهترین مدل را با کمترین MSE آموزش میدهد به عنوان تغییرات مدل بهینه تعیین شد.
4) ارزيابی مدل
عملکرد جامع مدلهای ML ترن شده (دادههای آموزشی)، از جمله دقت طبقهبندی، قابلیت پیشبینی و تفسیرپذیری زمینشناختی، توسط یک سری اندازهگیریهای کمی ارزیابی شد. دقت طبقهبندی یک مدل پیشبینیکننده را میتوان با ماتریس درهم ریختگی ارزیابی کرد، که در آن، نتیجه طبقهبندی یک نمونه را میتوان در چهار موقعیت زیر طبقهبندی کرد:
- (i) یک واقعه معدنی به درستی به عنوان یک واقعه طبقه بندی میشود که به عنوان نمونه مثبت واقعی یا TP نامیده میشود.
- (ii) یک واقعه معدنی به اشتباه به عنوان غیررخدادی طبقهبندی شده است که به آن نمونه منفی کاذب یا FN گفته میشود.
- (iii) یک نمونه غیر رخدادی به درستی در کلاس غیر رخدادی طبقه بندی میشود که به آن نمونه منفی واقعی یا TN گفته میشود.
- (IV) یک نمونه بدون وقوع به اشتباه به عنوان یک رخداد معدنی طبقه بندی شده است که به عنوان نمونه مثبت کاذب یا FP نامیده میشود.
بر اساس ماتریس درهم ریختگی، مجموعهای از شاخصهای آماری را میتوان برای ارزیابی عملکرد طبقهبندی مدلهای ML محاسبه کرد که میتواند به صورت زیر فرموله شود:
عملکرد کلی پیشبینی مدلهای ML توسط منحنی مشخصه عملکرد گیرنده (ROC) و منحنی نرخ موفقیت ارزیابی شد. این منحنیها نمایشهای گرافیکی دقت مدل با توجه به تنوع آستانههای تمایز هستند که نتایج پیش بینی یک سیستم طبقه بندی باینری را تعریف میکنند. به طور خاص، سلولی با مقدار احتمال بیشتر یا کمتر از آستانه تمایز به عنوان “رویداد معدنی” یا “عدم وقوع” پیشبینی شد که بر اساس آن حساسیت و ویژگی محاسبه شد. مناطق آینده پژوهی با آن سلولهایی که به عنوان وقوع معدنی طبقه بندی شده بودند، مشخص شدند.
با کاهش تدریجی آستانههای تمایز، منحنی ROC با رسم نرخ مثبت واقعی متناظر (همچنین به عنوان حساسیت که نشان دهنده نسبت نمونههای مثبت طبقه بندی شده صحیح است) در محور y در برابر نرخ مثبت کاذب (نسبت نمونههای منفی طبقه بندی نادرست) ایجاد شد، با (1-ویژگی)) روی محور x ارائه میشود، در حالی که منحنی میزان موفقیت با ترسیم درصد وقوع مواد معدنی موجود در مناطق آینده پژوه در برابر درصد مساحت مناطق آینده پژوهی ایجاد شد. علاوه بر این، سطح زیر منحنی ROC (AUC) به عنوان اندازهگیری کمی از عملکرد پیشبینی مدلهای ML استفاده شد.
بهره اطلاعاتی (IG) در این مشارکت برای تخمین تأثیر متغیرهای پیشبین ورودی بر روی مدلهای پیشبینی مورد استفاده قرار گرفت. این به تفسیر اهمیت نسبی ویژگیهای زمینشناسی مرتبط کمک میکند و بنابراین میتواند قابلیت اطمینان پیشبینیها را تأیید کند. به دست آوردن اطلاعات برای یک متغیر پیشبینیکننده خاص مربوط به نتیجه طبقهبندی خروجی Y را میتوان بهصورت زیر بدست آورد:
که در آن H(Y) مقدار آنتروپی Y است که برای توصیف غیرقابل پیشبینی بودن طبقهبندی به Y استفاده میشود، و H(Y|Fi) مقدار آنتروپی تغییر یافته Y پس از مرتبط شدن با یک ویژگی شواهد مشخص Fi است.
نتایج و بحث
پیکربندی مدل و تأثیر آن بر دقت طبقهبندی
برای یک مدلسازی پیشبینی مبتنی بر داده، پیکربندی مدل تا حد زیادی بر دقت پیشبینیها تأثیر میگذارد. MSE بهدستآمده از اعتبارسنجی متقاطع 10 برابری در این مطالعه برای ارزیابی دقت طبقهبندی در فرآیند آموزش استفاده میشود. شکل 8 تغییرات MSE را با ترکیبهای متغیر پارامترهای ML و مجموعه دادههای مختلف نشان میدهد.
اگرچه مدلهای ML فردی آموزشدیدهشده توسط سه مجموعه داده به سطوح مختلفی از دقت طبقهبندی دست مییابند، آنها الگوهای تغییرات مشابهی از MSE را با توجه به تغییرات پارامتر خاص نشان میدهند. به طور کلی، مدلهای RF و CNN عملکرد دقیقتر و پایدارتری نسبت به دو مدل دیگر ارائه میکنند و پیشبینیهایی با MSE کمتر از 0.19 ارائه میدهند و حساسیت کمتری به تغییرات پارامتر نشان میدهند.
مدلهای SVM نتایج طبقهبندی ضعیفی را با ارزش هزینه کم (<2.5) تولید میکنند، و مدلهای ANN پیچیدهترین و نادرستترین پیشبینیها را در فرآیند آموزش با توجه به الگوهای تغییرات MSE، به ویژه زمانی که نرخ یادگیری بیشتر از 0.2 باشد، ارائه میدهند. در میان تمام پارامترهای ML، برخی از پارامترهای مربوط به معماری مدل، از جمله تعداد درختها در RF، تعداد نورونها در ANN و همچنین تعداد نقشههای ویژگی و تعداد نورونها در CNN، پیچیدگی مدلهای مربوطه را تعریف میکنند.
معمولاً در بسیاری از زمینههای تحقیقاتی به رسمیت شناخته شده است که مدلهای پیچیده ML تمایل به پیش بینیهای دقیق تری دارند. با این حال، در این مطالعه با توجه به مدلسازی آینده پژوهی، یک تحلیل آماری از نتایج MSE با افزایش پارامترهای مرتبط با معماری انجام شد. نتایج نشان میدهد که معماری پیچیده مدلها منجر به عملکرد بهتر در مدلسازی آینده پژوه منطقه مورد مطالعه نمیشود، همانطور که در شکل 9 نشان داده شده است. با افزایش پارامترهای مربوطه، تمامی شاخصهای آماری، به ویژه کمترین MSE و میانگین MSE مورد استفاده برای ارزیابی خطای طبقه ندی، روند کاهشی آشکاری را نشان نمیدهند.
برعکس، افزایش تعداد درختها، نورونها و نقشههای ویژگی به طور قابلتوجهی هزینه محاسبات را افزایش میدهد. به طور ضمنی مشخص میشود که معماریهای دقیق مدلهای ML لزوماً در فرآیندهای مدل سازی ارائه شده در اینجا مورد نیاز نیستند. این مفهوم با برخی از مطالعات قبلی مطابقت دارد که نشان میدهند مدلهای پیچیده لزوماً به پیشبینیهای دقیقتری منجر نمیشوند. این نتایج ممکن است به اندازه کوچک مجموعه دادههای آموزشی نسبت داده شود که معمولاً از دهها مکان معدنی و غیر کانسار تشکیل میشود. مدلهای آموزشی با چنین مجموعه دادههای محدودی ممکن است به راحتی به دقت مطلوب دست یابند، در حالی که معماریهای پیچیده و آموزش بیش از حد ممکن است خطاهای بیش از حد برازش ایجاد کنند.
ارزیابی مدل و انتخاب نقشه چشم انداز
مدلهای ML که با ترکیب بهینه پارامترها آموزش داده شدهاند، پیشبینی را در هر سلول بهدست میآورند که با یک مقدار احتمال شناور از 0 تا 1 نشان داده میشود (شکل 10). الگوریتمهای ML آن سلولهایی را با مقادیر احتمالی بیشتر از 0.5 بهعنوان مناطق احتمالی که به طور بالقوه حاوی یک رخداد معدنی هستند برچسبگذاری میکنند. سلولهای دیگر به عنوان مناطق بایر بدون پتانسیل اکتشاف کافی مشخص میشوند.
طبق چنین سناریوی طبقهبندی، ماتریسهای سردرگمی مجموعه دادههای اعتبارسنجی برای چهار روش ML تولید و در جدول 2 فهرست شدهاند، که بر اساس آن، دقت طبقهبندی باینری به صورت کمی توسط شاخصهای آماری مختلف اندازهگیری میشود، همانطور که در جدول 3 فهرست شده است. مشاهده میشود که مدلهای فردی عملکردهای متفاوتی را در مجموعه دادههای مختلف و در شاخصهای متفاوت نشان میدهند. به طور کلی، مدل CNN هم در دقت کلی و هم در پیشبینی نمونههای مثبت و منفی، به دنبال مدلهای RF و SVM، بیشترین عملکرد را به دست میآورد، در حالی که مدل ANN پیشبینیهای نسبتاً بدتری را تولید میکند.
به طور خاص، مدل CNN حساس ترین است که به درستی 87.62٪ از مکانهای ذخیره را در هر سه مجموعه داده شناسایی میکند و پس از آن مدل RF (82.86٪) قرار دارد. مقادیر حساسیت مدلهای SVM و ANN هر دو کمتر از 80 درصد است. مدل CNN دارای ویژگی 97.14٪ است که نشان میدهد 97.14٪ از سلولهای غیرقابل رخ دادن به درستی به عنوان مناطق بایر طبقه بندی میشوند. بقیه مدلها نیز به ارزشهای بسیار بالایی از ویژگی دست مییابند: 93.34٪، 92.38٪، و 92.38٪ برای مدلهای SVM، RF و ANN به ترتیب. هر چهار مدل دارای مقادیر پیشبینی مثبت بالای بیش از 91 درصد هستند، به این معنی که بیش از 91 درصد سلولهای آینده پژوهی پیشبینیشده در واقع حاوی ووکورنس هستند.
مدل ANN کمترین نرخ پیشبینی منفی (80.85 درصد) را به دست میدهد، که نشان میدهد 80.85 درصد از سلولهای غیرقابل پیشبینی مکانهای غیر وقوع واقعی هستند. در مقابل، مدل CNN به بالاترین نرخ پیش بینی منفی (88.72٪) دست مییابد و پس از آن مدلهای RF (84.40٪) و SVM (81.04٪) قرار دارند. مدل CNN بالاترین دقت کلی 92.38 درصد را به دست میآورد که نشان میدهد 92.38 درصد از همه نمونهها به درستی طبقهبندی شدهاند، پس از آن مدل RF (87.62 درصد)، در حالی که مدلهای SVM (85.71 درصد) و ANN (85.24 درصد) مقادیر نسبتاً پایینی از دقت طبقهبندی تولید میکنند.
جدول 2. ماتریسهای سردرگمی مدلهای یادگیری ماشین در مجموعه دادههای اعتبارسنجی مختلف
جدول 3. عملکرد طبقهبندی مدلهای یادگیری ماشین
همه مدلهای ML میتوانند به درستی بیشتر رخدادهای شناخته شده (بیش از 78٪) را در مناطق احتمالی تعریف شده توسط سناریوی طبقهبندی پیشفرض (یعنی احتمال > 0.5) شناسایی کنند. بنابراین، مناطق هدف در حالت ایده آل دارای بالاترین اطمینان نسبت به کوچکترین منطقه هستند. ترسیم مناطق با اطمینان بالا و کارایی پیشبینی مدلها برای کاربردهای اکتشاف ضروری است و بنابراین باید به طور مؤثر ارزیابی شود.
عملکرد پیشبینی مناطق با احتمال بالا را میتوان توسط منحنی ROC ارزیابی کرد. نتایج طبقهبندی پیشبینیها با آستانههای متمایز متفاوت از مقادیر احتمال بالا تا پایین مورد قضاوت قرار میگیرند. در شرایط ایدهآل که همه نمونههای وقوع احتمال بیشتری نسبت به نمونههای غیر رخدادی دارند، منحنی ROC یک خط مستقیم y = 1 با بالاترین AUC 1 است. یک سلول غیر رخدادی با احتمال زیاد یا یک سلول رخدادی با احتمال کم باعث میشود که منحنی ROC از منحنی y = 1 منحرف شود و مقدار AUC کاهش یابد.
منحنیهای ROC چهار مدل ML آموزش داده شده توسط مجموعه دادههای ورودی متفاوت در شکل 11 نشان داده شده است. پیشنهاد میشود که هرچه یک منحنی ROC به گوشه سمت چپ بالا نزدیکتر باشد، به منحنی y = 1 نزدیکتر است و مدل بهتر عمل میکند. منحنی ROC مدل RF در تمام موارد به گوشه بالا سمت چپ نزدیکترین است و بالاترین مقادیر AUC را دارد که بیشتر از 0.95 است. مدلهای SVM و CNN عملکرد قابل مقایسه با بالاترین مقادیر AUC ثانویه را نشان میدهند، در حالی که مدل ANN ضعیفترین قابلیت پیشبینی را در ارزیابی منحنیهای ROC انجام میدهد.
منحنی نرخ موفقیت در آشکار کردن کارایی پیشبینی مدلها ساده است. همانطور که در شکل 12 نشان داده شده است، منحنی نرخ موفقیت هر مدل را میتوان با سه خط رگرسیون با شیبهای مختلف برازش داد. شیب تندتر نشان دهنده راندمان پیش بینی بالاتر است. مناطق آینده پژوه شناسایی شده، رخدادهای شناخته شده بیشتری را در مناطق مشخص شده کوچکتر ثبت میکنند.
از این نظر، منطقهبندی آینده پژوه را میتوان بر اساس آستانههای شناسایی شده توسط تقاطع خطوط رگرسیون همسایه انجام داد که پتانسیل بالا، متوسط و پایین را برای کشف رخدادهای W جدید نشان میدهند.(شکل 13). شایان ذکر است که تنها مناطق با پتانسیل بالا، معمولاً با شیب منحنی نرخ موفقیت بیشتر از 5، مناطق آینده پژوه مناسب برای اکتشاف بیشتر هستند. سایر نواحی دارای شیب مساوی یا کمتر از 1، معادل یا کمتر از چگالی پراکنده طبیعی هستند (یعنی هر 1٪ از منطقه شامل 1٪ از موارد معدنی است).
بنابراین، کارایی پیشبینی مدلهای ML به شیب بخش اول منحنی میزان موفقیت بستگی دارد. مدل RF کارآمدترین عملکرد پیشبینی را با بیشترین شیب 6.7797 به دست میآورد، که مناطق با پتانسیل بالا را مشخص میکند که تنها 9٪ از کل منطقه را پوشش میدهد، اما 66.95٪ از رخدادهای موجود را ثبت میکند. مدلهای SVM (6.4241)، CNN (5.3232)، و ANN (5.1835) با توجه به شیبهای پایینتر خود کارایی کمتری دارند. رتبه اولویت مدلهای نشان داده شده توسط منحنیهای میزان موفقیت، رتبه بندی ثابت بر اساس منحنیهای ROC است (شکلهای 12 و 13).
با توجه به دقت طبقهبندی و قابلیت پیشبینی، میتوان نتیجه گرفت که مدل CNN بهترین موتور تشخیص است، اما پیش بینی خوبی برای کاربرد MPM منطقه مورد مطالعه نیست، در حالی که مدل RF یک موتور تشخیص خوب و بهترین پیش بینی کننده است. مدل RF بهعنوان مدل بهینه برای هدفیابی اکتشاف انتخاب میشود، زیرا راندمان پیشبینیکننده باید در فرآیند تصمیمگیری اکتشافات بیشتر مواد معدنی رتبه اول را داشته باشد. بنابراین، نقشه پیشبینی تولید شده توسط مدل RF به عنوان نقشه آینده پژوهی نهایی مورد استفاده قرار میگیرد (شکل 13a).
تفسیر زمینشناسی مدلهای پیشبینیکننده و پیامدهای اکتشافات معدنی آینده
تفسیر نتایج مدلسازی با کمی کردن اهمیت نسبی هر یک از ویژگیهای شواهدی که به مدلهای پیشبینی نهایی کمک میکنند انجام شد (شکل 14). انومالی W مهمترین سهم را در چهار مدل پیشبینی میکند، به دنبال آن انومالی منگنز، نزدیکی به تودههای نفودی یانشانی و تراکم تقاطعهای گسلی قرار دارند. سایر ویژگیها بهعنوان متغیرهای پیشبینیکننده در مدلسازی MPM سهم قابلتوجهی ندارد. در میان متغیرهای پیشبینیکننده مهم، Wanomaly نشانه مستقیم کانیسازی هدفگذاری شده در منطقه مورد مطالعه است، بنابراین بیشترین تأثیر را بر مدلسازی پیشبینیکننده دارد. شایان ذکر است که انومالی منگنز تأثیر قابل توجهی بر مدلهای پیش بینی کننده دارد.
چنین تأثیری حتی بیشتر از تأثیرات اعمال شده توسط نزدیکی به تودههای نفودی یانشانی و ساختارهای منطقه ای است که عوامل کنترل کننده سنگ معدن به خوبی شناخته شده هستند.اگرچه W، منگنز، و آهن اجزای حیاتی ولفرامیت هستند که بر تنگستات سنگ معدن در منطقه مورد مطالعه غالب است، و انومالی ژئوشیمیایی مدتهاست که در اکتشافات معدنی عملی مورد تاکید قرار گرفتهاند. آنومالی منگنز و آهن قبلاً نادیده گرفته میشد، زیرا فرض میشد همه عناصر تشکیلدهنده سنگ ولفرمیت از مایعات ماگمایی منشأ میگیرند.
با این حال، یک مطالعه اخیر نشان میدهد که آهن و منگنز حاصل از سنگهای میزبان، کنترل قاطعی بر بارش ولفرامیت در منطقه Panasqueira (پرتغال) اعمال میکند. و استنباط میکند که غنی سازی آهن در سنگهای میزبان منجر به غلبه فربریت (FeWO4) در سنگ معدن ولفرامیت میشود. برهمکنش سیال-سنگ ممکن است نقش مهمی در تشکیل ولفرامیت در استان جیانگشی جنوبی داشته باشد و غنیسازی منگنز/آهن در سنگهای دیواره ممکن است پیشنیاز تشکیل ولفرامیت باشد. برخی از شواهد در زیر به طور خلاصه آورده شده است.
(i) در یک کار اخیر انجام شده بر روی کانسار Xihuashan در منطقه مورد مطالعه، تجزیه و تحلیل LA-ICP-MS از ادخال سیال نشان میدهد که مایع معدنی در آهن و منگنز تخلیه شده است. وجود سيدريت و پيروفانيت در سنگهاي ديواره شاهد رها شدن آهن و منگنز در هنگام دگرساني سنگ ديواره است.
(ii) در یک کار منتشر نشده توسط Wu (یکی از نویسندگان همکار این مقاله)، دگرسانی شدیدی در سنگهای دیواره مجاور رگههای سنگی حاوی ولفرامیت در کانسار Piaotang در منطقه مورد مطالعه مشاهده شد. کلریت و بیوتیت با مسکوویت و پیروفانیت جایگزین شدند. پیروفانیت و کلریت باقیمانده که به طور گسترده در سنگهای دیواره توزیع شدهاند، منطقهای غنی شده از منگنز / آهن را تشکیل میدهند.
سنگهای دیواره نزدیک میتوانند منبع منگنز/آهن کافی برای بارش ولفرامیت در هنگام برخورد سیالات غنی شده با W به این سنگها فراهم کنند. منبع فلزی منگنز/آهن از سنگهای دیوار میتواند توضیح دهد که چرا انومالیهای منگنز تأثیر قابلتوجهی بر مدلسازی آینده پژوه در این مطالعه دارند. همبستگی فضایی انومالیهای منگنز و کانیسازی در منطقه مورد مطالعه نیز با تجزیه و تحلیل وزن شواهد آشکار میشود.
همچنین اشاره شده است که انومالی آهن اطلاعات شواهد کمی برای پیشبینی کانیسازی فراهم میکند، که ممکن است به (الف) اکثر هوبنریت (MnWO4) در سنگهای ولفرامیت از نهشتههای W-Sn که بر کانیسازی چند فلزی W در منطقه مورد مطالعه غالب هستند، نسبت داده شود. (ب) تداخل بسترهای قرمز کرتاسه غنی شده با آهن که پس از کانی سازی W در منطقه مورد مطالعه تشکیل شده است. مواد کانهساز سنگهای دیواره نقش مهمی در تشکیل سنگهای ولفرامیت ایفا میکنند و آنومالی منگنز باید به عنوان یک معیار مهم اکتشاف در نظر گرفته شود. این معیار ممکن است اکتشاف تنگستن آینده را تسهیل کند و بینشهایی را در مورد مدل ژنتیکی کانیسازی تنگستن در این منطقه ارائه دهد.
نتیجهگیری و کار آینده
مدلسازی پیش بینی آینده پژوهی مواد معدنی در استان جیانگشی جنوبی انجام شد. بر اساس دادههای اکتشافی فراوان و اطلاعات جغرافیایی چندمنبعی در دسترس عموم، سه مجموعه داده ورودی شامل 118 رخداد شناخته شده، 118 مورد غیرقابل انتخاب بهطور تصادفی و هشت ویژگی شواهد مرتبط با کانیسازی W تهیه شد. مجموعه ای از مدلهای ML شامل RF، SVM و ANN، و همچنین مدل CNN یادگیری عمیق با استفاده از مجموعه دادههای ورودی مختلف آموزش داده شد و عملکرد مدلهای حاصل با ماتریس درهم ریختگی، منحنی ROC و منحنی نرخ موفقیت ارزیابی شد.
در فرآیند آموزش، مدلهای CNN و RF دقت و پایداری زیادی در برابر تغییرات پارامترهای مدل ارائه میدهند. تحلیل حساسیت نشان میدهد که مدلهای پیچیده با معماری پیچیده لزوماً عملکرد پیشبینیکننده را در MPM منطقه مورد مطالعه بهبود نمیبخشند. عملکرد پیشبینی مدلهای آموزشدیده بهمنظور انتخاب بهینه برای تولید نقشه آیندهپژوهی، بهطور جامع مورد ارزیابی و مقایسه قرار گرفت. با توجه به دقت طبقهبندی، مدل CNN دقیقترین عملکرد را به دست میآورد که 92.38 درصد از نمونههای برچسبگذاری شده را به درستی طبقهبندی میکند و به سایر شاخصهای آماری مشتقشده از ماتریسهای درهم امیختگی منجر میشود و به دنبال آنها مدلهای RF، SVM و ANN قرار میگیرند.
عملکرد کلی پیشبینی مدلهای ML توسط منحنیهای ROC ارزیابی شد، که نشان میدهد مدل RF از بقیه مدلهای ML بهتر عمل میکند. منحنیهای نرخ موفقیت نشان میدهند که مناطق آیندهنگر شناساییشده توسط مدل RF، رخدادهای W شناختهشدهتر را در مناطق مشخصشده کوچکتر ثبت میکنند، که کارآمدترین عملکرد پیشبینیکننده را نشان میدهد. با توجه به اندازهگیریهای فوق از ارزیابی مدل، مدل RF به عنوان بهترین مدل برای تولید مدل آیندهنگر برای اکتشاف بیشتر در منطقه مورد مطالعه انتخاب شد.
مناطق با پتانسیل بالا 95/66 درصد از رخدادهای موجود را در 9 درصد از کل مساحت این منطقه به خود اختصاص میدهند. نتایج مدلسازی اهمیت نسبی ویژگیهای شواهدی را که به پیشبینیها کمک میکنند رتبهبندی میکند. مشخص شد که انومالی W، انومالیهای منگنز، نزدیکی به تودههای نفوذی یانشانی و تراکم تقاطعهای گسلی مهمترین ویژگیها برای پیشبینی کانیسازی W هستند. انومالیهای منگنز در سنگهای میزبان نشاندهنده یک معیار اکتشافی نوآورانه است که مدتها در اکتشاف معدنی عملی در منطقه مورد مطالعه نادیده گرفته شده است و میتواند بینشی در مورد مدل ژنتیکی کانیسازی W در این منطقه ارائه دهد.
محدودیتهایی در MPM این مطالعه وجود دارد و کارهای بیشتری باید در آینده انجام شود. اولاً، اگرچه ارتباط فضایی و ژنتیکی انومالیهای منگنز و کانیسازی W در این مطالعه نشان داده شده است، شایان ذکر است که منگنز در رسوبات بخار همزمان رسوب میکند و به واکنش اکسیداسیون – کاهش در آب حساس است. دادههای قابل اعتمادتر، مانند دادههای ژئوشیمیایی سنگ و خاک، باید هنگام استفاده از مدل آینده پژوه و هدف قرار دادن انومالیهای منگنز به عنوان شاخص کانیسازی W در کار اکتشاف آینده جمعآوری و تجزیه و تحلیل شوند.
ثانیا، کاربرد مدلهای ML را میتوان افزایش داد. دو عامل اصلی وجود دارد که عملکرد سودمند مدلهای هوش مصنوعی را در زمینه MPM تضعیف میکند: 1) موارد معدنی مورد استفاده برای آموزش مدلهای ML در مقایسه با هزاران نمونه بکار رفته در زمینه تشخیص تصویر، کمیاب است. و 2) الگوی کانیسازی تحت شناسایی آنقدر پیچیده است که نمیتوان آن را با دادههای آموزشی محدود بهطور مؤثر ثبت کرد. زیرا کانیسازی محصول نهایی فعل و انفعالات پیچیده فرآیندهای تشکیل سنگ است که نشانههایی از الگوهای خود را در قالب ویژگیهای مختلف زمینشناسی غیرخطی همبسته به جا میگذارد. در این راستا، تلاشهای بیشتری از جمله مهندسی دانش محور و استفاده از بیان موثر لایههای قابل اطمینان ، با توجه به اینکه مشکل دادههای ورودی کمیاب در این مرحله قابل حل نیست، باید به مدلهای ML کمک کرد تا سیستمهای معدنی پیچیده را در کار آینده یاد بگیرند.