بررسی سیستماتیک کاربردهای یادگیری ماشینی در معدن
پیشرفتهای اخیر در فناوری معدنکاری هوشمند، تولید، جمعآوری و به اشتراک گذاری مقدار زیادی از دادهها را در زمان واقعی امکانپذیر نموده است. بنابراین، تحقیق بهکارگیری یادگیری ماشین (Machine Learning) که از این دادهها استفاده میکند به طور چشمگیری در صنعت معدن انجام میشود. در این مطالعه، ما ۱۰۹ مقاله تحقیقاتی را که در طی چند دهه گذشته انجام شده است مرور کردیم، که این مقالات در مورد تکنیکهای ML برای اکتشافات معدن، استخراج (عملیات بهرهبرداری)، و بازسازی معدن بحث میکنند. روندهای تحقیق، مدلهای ML و روشهای ارزیابی که در ابتدا در ۱۰۹ مقاله به کار رفته بودند به طور سیستماتیک تجزیه و تحلیل شدند. نتایج نشان داد که مطالعات یادگیری ماشین به طور فعال در صنعت معدن از سال ۲۰۱۸، عمدتا برای اکتشاف مواد معدنی انجام شده است. در میان مدلهای ML، ماشین بردار پشتیبان بیشترین استفاده را داشت، که با مدلهای یادگیری عمیق دنبال میشد. مدلهای ML عمدتا از نظر ریشه میانگین مربع خطا و ضریب تعیین ارزیابی شدند.
مقدمه
انسانها به دلیل توانایی تفکر خود از زندگی روزمره خود درس هایی را میگیرند. به عنوان مثال، آنها میتوانند از آموزش و یا از افکار و خاطرات خود یاد بگیرند. با این حال، کامپیوترها بر خلاف انسانها از طریق الگوریتمها یاد میگیرند. این یادگیری ماشین (Machine Learning) نامیده میشود. ML از الگوریتمهای کامپیوتری برای شبیهسازی یادگیری انسان استفاده میکند و به کامپیوترها اجازه میدهد تا دانش را از دنیای واقعی شناسایی و به دست آورند، در نتیجه عملکرد برخی از وظایف را بر اساس دانش به دست آمده بهبود میبخشد. دقیقا، ML به صورت زیر تعریف میشود: “گفته میشود یک برنامه کامپیوتری از تجربه E مربوط به کلاس خاصی از وظایف T و اندازهگیری عملکرد P یاد میگیرد، اگر عملکرد آن در وظایف T، همانطور که توسط P اندازهگیری میشود، با تجربه E بهبود یابد” (۱). اگرچه مفاهیم اولیه ML از دهه ۱۹۵۰ آغاز شد، ML در دهه ۱۹۹۰ به عنوان یک حوزه مستقل در نظر گرفته شد (۱). الگوریتمهای ML در زمینههای کامپیوتر (۲، ۳)، سلامت (۴)، محیطزیست (۵)، پزشکی (۶، ۷)، انرژی (۸) و خدمات (۹) استفاده میشوند.
معدنکاری هوشمند در صنعت معدن در نظر گرفته میشود. فناوری معدنکاری هوشمند، معرفی فناوری اطلاعات و ارتباطات لبه برش، مانند اینترنت اشیا (IoT)، کلان دادهها (بیگ دیتا)، موبایل، هوش مصنوعی (AI)، واقعیت افزوده، و واقعیت مجازی، در زمینه توسعه منابع معدنی است (۱۰). به دلیل توسعه فناوریهای معدنکاری هوشمند، حجم زیادی از دادهها در حال تولید، جمعآوری و به اشتراکگذاری در زمان واقعی هستند. در دسترس بودن دادههای مختلف مانند دادههای حفاری، دادههای دریافتی از حسگرها، و توسعه دادههای اندازهگیری تکنیکهای AI، پیشرفت مهارتهای محاسباتی کامپیوترها، و ML توجه را به علم داده در زمینه معدن جمعآوری کرده است.
پروژههای مختلفی برای اعمال ML در سایتهای معدن در حال اجرا هستند. برای به دست آوردن ذخایر طلای بیشتر از معدن رد لیک در کانادا، زمینشناسان در گولدکورپ از ابرکامپیوترهای هوش مصنوعی IBM برای تفسیر دادههای اکتشاف و سپس کشف موادمعدنی جدید استفاده کردند (۱۱، ۱۲). تولیدکنندگان تجهیزات سنگین برای ساختوساز و معدن، مانند کوماتسو و NVIDIA، پروژههای مشترکی را برای کمک به شناسایی کارگران و تجهیزات در سایتهای معدن پیاده کردند. فناوریهای توسعهیافته میتوانند تجهیزات ناکارآمد را شناسایی کنند و کارگران را ایمن نگه دارند (۱۳). نیوتراکس، شرکتی که خدمات سیستم مدیریت ایمنی و عملیاتی را در معادن زیرزمینی فراهم میکند، و IVADO، یک موسسه تحقیقاتی هوش مصنوعی کانادایی، در پروژههای آزمایشی برای جمعآوری کلان دادهها از سنسورهای نصب شده در تجهیزات معدن، تجزیه و تحلیل دادهها از طریق ML برای پیشبینی زمانی که تجهیزات معدن از کار میایستند (خراب میشوند) و نیاز به نگهداری دارند، همکاری میکنند (۱۴، ۱۵).
در (۱۶ – ۱۹)، برنامههای ML برای پردازش موادمعدنی و همچنین فناوری محاسبات نرم در اکتشاف، روندهای دیجیتالی سازی در صنعت معدن، و اتوماسیون در بخش معدن بررسی شدهاند. با این حال، این مطالعه فاقد یک بررسی سیستماتیک از برنامههای ML در معدن است، که شامل اکتشافات معدن، استخراج (عملیات بهرهبرداری)، و بازسازی معدن است.
بنابراین، این مطالعه به طور سیستماتیک روشهای مورد استفاده توسط پروژههای تحقیقاتی ML و پیادهسازی آنها در زمینه استخراج را بررسی میکند/ روند تحقیق ML، مدلهای ML و معیارهای ارزیابی مدل ML استفاده شده در پروژههای تحقیقاتی به طور عمده بررسی میشوند. لازم به ذکر است که پروژههای تحقیقاتی ML برای پردازش موادمعدنی در این مطالعه مورد توجه قرار نگرفت زیرا بررسیهای آنها قبلاً در مقالات ارائه شده بود (16).
روشهای بررسی سیستماتیک
مرور مطالب یا بررسی سیستماتیک (اغلب به عنوان مرور سیستماتیک نامیده میشود) شناسایی، ارزیابی، و تفسیر تمام تحقیقات در دسترس مربوط به یک سوال پژوهشی خاص، موضوع، یا یک پدیده را تسهیل میکند (۲۰). این بررسی در نظر دارد راهحلهایی برای سوالات مرتبط با تحقیق ارائه دهد.
در این مطالعه، سوالات تحقیق در ابتدا برای تعریف دامنه و اهداف کلی تجزیه و تحلیل سازماندهی شدند. پس از آن، یک روش جستجو برای یافتن کارآمد مقالات تحقیقاتی مرتبط با سوالات تحقیق طراحی شد، که با ایجاد استانداردهایی برای انتخاب مطالعات مناسب از نتایج جستجو دنبال شد. سپس چکیده و نتایج مقالات برای یافتن ارتباط آنها در زمینه تحقیق مورد بررسی قرار گرفت. این فرآیند با استخراج دادهها از مقاله برای تشخیص و ساختاربندی اطلاعات مربوطه به شرح زیر دنبال شد:
- RQ1: روند تحقیقات ML در صنعت معدن چیست؟ (سالانه، منابع انتشار، زمینههای کاربردی دقیق)
- RQ2: کدام مدلهای ML در تحقیق شما استفاده شدند؟ (نوع داده، کلان دادهها، فرکانس استفاده از مدل، کاربرد دقیق در زمینه)
- RQ3: شما چگونه مدلهای ML را ارزیابی کردید؟ (دادههای ارزیابی مدل، معیارهای ارزیابی، تعیین نتایج ارزیابی توسط مدلها)
هدف اصلی این بررسی گزارش وضعیت فعلی استفاده ML در بخش معدن بود. سوالات تحقیق با توجه به هدف انتخاب شدند.RQ1 با هدف توصیف گرایشها در تحقیقات ML در زمینه معدن است. این مقاله با ملاحظه به وضعیت فعلی انتشار پایاننامه سالانه و کاربردهای دقیق آنها در این زمینه اشاره میکند. RQ2 مدل ML استفاده شده در مطالعه را طبقهبندی میکند. به طور خاص، به نوع دادههای یادگیری، استفاده از مقدار زیادی از دادهها، و فرکانس استفاده از مدل و کاربرد دقیق آن در این زمینه اشاره میکند. RQ3 ارزیابی مدلهای ML را تحلیل میکند. به طور مفصل، به دادههای ارزیابی مدل ML، معیارهای ارزیابی، و نتایج ارزیابی توسط مدل اشاره میکند.
روش جستجو
ما از گوگل و اسکوپوس به عنوان موتورهای جستجو استفاده کردیم. ما واژههای کلیدی جستجو مربوط به موضوع این بررسی را استخراج کردیم: معدن، موادمعدنی، یادگیری ماشینی، یادگیری عمیق، معدن روباز، معدن زیرزمینی. کلمات کلیدی، یادگیری ماشین و یادگیری عمیق، برای پیدا کردن مقالاتی استفاده شدند که از ML و روشهای یادگیری عمیق در میان روشهای مختلف تحقیق استفاده میکنند. بقیه کلمات کلیدی زمینه را تعریف کردند. برای تجزیه و تحلیل روند تحقیقات در دهه گذشته، تنها پروژههای تحقیقاتی که بین ژانویه ۲۰۱۱ و سپتامبر ۲۰۲۰ انجام شدند در نظر گرفته شدند. ما با استفاده از روش توصیفی، ۲۶۴ مقاله منتخب را به دست آوردیم.
معیارهای انتخاب
مقالات منتشر شده را میتوان با معیارهای اصالت، نفوذ بالا، و استانداردهای بالا در نظر گرفت. این امر به این دلیل است که چنین نسخههای خطی توسط کارشناسان بررسی میشوند و سپس براساس آن قبل از انتشار تجدید نظر میشوند. بنابراین، ما مقالات منتشر شده را انتخاب کردهایم. معیارهای انتخاب به شرح زیر بودند: (۱) مقالات تحقیقاتی؛ (۲) متن کامل؛ (۳) حذف مقالات فرآوری موادمعدنی. این معیارها نیز به خاطر دلایل زیر انتخاب شدند: تنها مقالات تحقیقاتی برای تجزیه و تحلیل وضعیت فعلی ML استفاده شدند، و متن کامل یک تجزیه و تحلیل دقیق از محتوای مقاله را ممکن کرد. فرآوری موادمعدنی حذف شد زیرا چند مطالعه اخیر در مورد کاربردهای ML در فرآوری موادمعدنی بررسی و منتشر شده بودند (16).
پایگاه داده نتایج جستجو شامل ۲۶۳ مقاله بود. به دلیل معیار اول، تعداد مقالات مرتبط به ۲۵۱ کاهش یافت. معیار دوم تعداد را به ۲۴۹ کاهش داد. پس از سه مرحله، همان طور که در شکل ۱ نشان داده شده است، ۱۰۹ مقاله انتخاب شدند.
نتایج بررسی
RQ1: روندهای تحقیقاتی یادگیری ماشین در صنعت معدن
سال انتشار
برای بررسی روند تحقیق، ما تصمیم گرفتیم که سال انتشار مقالات تحقیقاتی را به عنوان یک گام اولیه بررسی کنیم. شکل ۲ توزیع تحقیقات را از ژانویه ۲۰۱۱ تا سپتامبر ۲۰۲۰ نشان میدهد. این روند افزایشی شدید را در سه سال گذشته نشان میدهد. میتوان مشاهده کرد که ۵۱ مقاله از ۱۰۹ مقاله قبل از سال ۲۰۱۸ مورد مطالعه قرار گرفتند. تعداد مطالعات انجام شده در سالهای ۲۰۱۸، ۲۰۱۹ و سپتامبر ۲۰۲۰ به ترتیب ۱۸، ۲۸ و ۱۲ بوده است. در سال ۲۰۱۸، تعداد مقالات منتشر شده سه برابر بیشتر از سال قبل بود. تحقیقات انجام شده در سه سال گذشته حدود ۵۳% از کل تحقیقات انجام شده در ده سال گذشته را تشکیل میدهند.
منبع انتشار
مقالات تحقیقاتی متعددی در مجلات مختلف منتشر شدهاند. جدول ۱ جزئیات نشریات در مجلات برتر را به همراه تعداد مقالات منتشر شده خلاصه میکند. بیشترین تعداد مقالات در تحقیقات منابع طبیعی، زمینشناسی کاربردی مجدد علوم و به دنبال آن مقالات دیگر یافت شد.
زمینههای کاربردی دقیق
ما زمینههای مربوط به تحقیقات فعال را مورد تجزیه و تحلیل قرار دادیم. برای طبقهبندی کار، یک نقشه فنی از بخش معدن تهیه شد. مرحله اول شامل سه مرحله از فرآیند استخراج بود که اکتشاف، بهرهبرداری و احیای معدن بودند. هر آیتم با جزئیات طبقهبندی شد. مرحله دوم شامل اکتشاف موادمعدنی و هدفگذاری ، و ارزیابی و برنامهریزی معدن تحت فاز اکتشافات بود. مرحله استخراج (عملیات بهرهبرداری) به عنوان حفاری و آتشکاری، مدیریت تجهیزات، مدیریت ژئوتکنیکی و معدنکاری ایمن طبقهبندی شد. مرحله بازسازی به پوشش گیاهی (مانیتورینگ) و خطرات معدن (ارزیابی) تقسیم شد. در مرحله سوم، ما زمینههای مرتبط را تحت آیتم مرحله دوم اضافه کردیم. همان طور که در شکل ۳ نشان داده شده است، با استفاده از ۱۰۹ مقاله، میدان معدنی را به ۳۴ میدان تقسیم کردیم.
در مرحله اول طبقهبندی فرآیند استخراج، ۵۹ مطالعه در مرحله استخراج (عملیات بهرهبرداری) انجام شد (در شکل ۴ نشان داده شده است). شکل ۵ وضعیت تحقیق آیتمها را در مرحله سوم طبقهبندی نشان میدهد. در مجموع ۱۱ مطالعه مربوط به مدلسازی و نقشهبرداری ذخیره کانسار، ۱۰ مطالعه مربوط به پیشبینی لرزش زمین در زمینه استخراج و ۶ مطالعه مربوط به آلودگی آب و خاک در مرحله بازسازی انجام شد.
وضعیت تحقیق هر زمینه به عنوان عناصر مرحله دوم مورد بررسی قرار گرفت. در زمینه اکتشاف و هدف قرار دادن موادمعدنی، یک مطالعه تشخیص ناهنجاری ژئوشیمیایی (۲۱) که از دادههای اکتشافی برای تشخیص ناهنجاریهای ژئوشیمیایی استفاده میکند، انجام شد. مطالعات نقشهبرداری زمینشناسی (۲۲ – ۲۴) با استفاده از ویژگیهای سنگها انجام شد. تجزیه و تحلیل موادمعدنی (۲۵ – ۳۱) با استفاده از دادههای حفاری یا نمونهها انجام شد. یک مطالعه مدلسازی و نقشهبرداری اکتشاف موادمعدنی (۳۲ – ۴۲) برای ارزیابی پتانسیل موادمعدنی با استفاده از دادههای اکتشاف انجام شد.
در حوزههای برنامهریزی و ارزیابی معدن، تحقیق بر روی برآورد هزینه (۴۳، ۴۴) به منظور پیشبینی هزینههای عملیات معدن و برنامهریزی معدن (۴۵، ۴۷) به منظور بهینهسازی طراحی معدن انجام شد. برآورد ذخیره (۴۹، ۴۸) تحقیقی انجام شد که ذخایر و ارزشهای اقتصادی مورد نیاز برای عملیات معدن را در نظر میگرفت.
در موارد حفاری و آتشکاری، پیشبینی فشار هوا (۵۰، ۵۱)، پیشبینی شکست یا عقبزدگی (۵۲، ۵۴)، پیشبینی پرتاب سنگ (۵۵، ۵۸)، پیشبینی پرتابسنگ و پیشبینی فشار هوا (۵۹)، پیشبینی لرزش زمین (۶۰، ۶۹) و برآورد خردشدگی سنگ (۷۰) برای بررسی تغییرات در فشار هوا، ارتعاش، بنا یا بقعه و لرزش ایجاد شده در حین حفاری و آتشکاری انجام شد. یک مطالعه پیشبینی آسیب (۷۲، ۷۱) انجام شد، که در آن آسیب ناشی از آتشکاری یک معدن روباز به نواحی مسکونی اطراف پیشبینی شد (۷۱).
در مقوله مدیریت تجهیزات، یک مطالعه تشخیص خطا (۷۳، ۷۴) انجام شد که نقص تجهیزات را تشخیص داد. عملیات حمل و نقل (۷۹ / ۷۵) و ناوبری (۸۰) به ترتیب برای بهینهسازی وسایل حمل و نقل، مانند کامیونها و لودر، و برای نشان دادن حالت حمل و نقل تجهیزات انجام شد. مطالعه نگهداری و تعمیرات پیشگویانه (۸۱) به منظور افزایش بهرهوری عملیات معدن با پیشبینی شکست یا خرابی تجهیزات انجام شد.
در دسته مدیریت ژئوتکنیکی، تکنیک پیشبینی پایداری ستون (۸۲) پایداری ستونهای زیرزمینی معدن را پیشبینی میکند. پیشبینی انفجار سنگ (۸۳ – ۸۵) برای طبقهبندی و پیشبینی انفجار سنگها با استفاده از مشخصات و دادههای زمانی سنگهای منفجر شده انجام شد. مطالعات مدیریت شیب (۸۶ – ۹۰) برای پیشبینی تغییر شکل شیب معدن و ارزیابی پایداری آن انجام شد. طراحی دامپ باطله (۹۱ – ۹۳)، طراحی و استحکام محل دفن را پیشبینی میکند.
در مورد معدنکاری ایمن، مطالعهای بر روی کنترل زهکشی (۹۴ – ۹۷) برای پیشبینی سطح آب زیرزمینی یا جریان ورودی معادن انجام شد. مطالعات کنترل گرد و غبار، کیفیت هوای معادن را ارزیابی و پیشبینی کردند (۹۸ – ۱۰۰). یک مطالعه وقوع زلزله (۱۰۱،۱۰۲) را با در نظر گرفتن دادههای زمانی افزایش فعالیت لرزهای در معادن زغالسنگ پیشبینی کرد. یک مطالعه کنترل گاز (۱۰۳ – ۱۰۵) برای پیشبینی تولید گازهای خطرناک در معادن انجام شد. مطالعاتی در مورد ایمنی شغلی (۱۰۶،۱۰۷) وجود داشت که تجهیزات را کشف و احتمالات تصادف را پیشبینی میکرد، در نتیجه از حوادث جلوگیری میکرد و طراحی تهویه مناسب را تسهیل میکرد (۱۰۸).
در حوزه تشخیص پوشش گیاهی، مطالعات تشخیص تغییرات (۱۰۹ – ۱۱۳) و نقشهبرداری پوشش گیاهی (۱۱۴ – ۱۱۷) به ترتیب برای تشخیص پوشش گیاهی که در طول عملیات معدن تغییر کرده است و طبقهبندی ترکیب سطح انجام شد.
در بخش ارزیابی خطرات معدن، یک مطالعه ارزیابی زیستمحیطی (۱۱۸) کیفیت محیطی جغرافیایی را ارزیابی و طبقهبندی کرد. مطالعهای برای پیشبینی و ارزیابی آلودگی خاک و آب (۱۲۴ – ۱۲۹) ناشی از عملیات معدن انجام شد.
RQ2: مدلهای یادگیری ماشین
نوع مجموعه داده
چندین مجموعه داده در مطالعات ML استفاده شدهاند. دادهها یا از منابع باز قابلدسترس عمومی و یا به صورت جداگانه در مورد دادههای خصوصی به دست آمدند. بنابراین، دادهها به دادههایی طبقهبندی میشوند که میتوانند به طور مستقیم در این زمینه مورد استفاده قرار گیرند، دادههایی که باید در این زمینه به دست آیند و پس از آن یک پردازش آزمایشگاهی قرار گیرند و بعدا میتوانند به صورت عمومی مورد استفاده قرار گیرند. مجموعههای داده منبع باز مورد استفاده به صورت عمومی در دسترس هستند و یا در ماهیت خصوصی هستند (مانند RapidEye، NASA و Minto) (۲). در یک مطالعه، تحقیق با استفاده از دادههای مختلف انجام شد.
بنابراین، تعداد کل استفاده از دادهها ۱۲۱ مورد بود. بیشترین تعداد دادههای مورد استفاده، ۵۷ داده بود که که از منبع باز بدست آمده بود (شکل 6).
کلان داده
کلان داده معمولا از ۱ ترابایت تا ۱ پتابایت داده است و شامل داده ساختار یافته (برای مثال، جدول اعداد) و داده ساختار نیافته (برای مثال، عکس و اسناد) است (۱۳۰). به عبارت دیگر، این یک تکنولوژی است که از دادههای زیادی استفاده میکند. الگوریتمهای ML، طبق تعریف، عملکرد خود را با دسترسی به دادههای اضافی بهبود میبخشند (۸). بنابراین، دادهها تحقیق شامل ML را تحتتاثیر قرار میدهد. مقدار زیادی از دادهها مفید هستند و میتوانند به سایتها و آزمایشگاههای مختلف اعمال شوند. بنابراین، ما مطالعاتی را در نظر گرفتیم که بحث یا نظری در مورد دادههای بزرگ داشتند. جدول ۲ تعداد مطالعاتی را نشان میدهد که کلان دادهها را در نسخههای خطی خود شامل میشوند یا ذکر میکنند.
مدلهای ML
براساس مقاله انتخاب شده، مدل ML طبقهبندی شد. در یک مطالعه خاص، مطالعات از مدلهای مختلفی برای مقایسه مدلها استفاده کردند. در نتیجه تجزیه و تحلیل مطالعات، تعداد کل مدلهای مورد استفاده ۲۵۵ مورد بود. این مدلها در مجموع به ۱۲ نوع طبقهبندی شدند: یادگیری عمیق، یادگیر جمعی یا ترکیبی، خوشهبندی، کاهش ابعاد، الگوریتمهای ژنتیک، شبکه عصبی، بیزین (قضیه بیزی)، درخت تصمیمگیری، مبتنی بر نمونه، رگرسیون، ماشین بردار پشتیبان (SVM)، و فرآیند گاوسی. شکل ۷ جزئیات طبقهبندی تکنیک ML را نشان میدهد. شکل ۸ بسامد استفاده از مدلهای ML در مطالعه را نشان میدهد. رایجترین مدلهای مورد استفاده: ماشین بردار پشتیبان یا SVM (n=58)، یادگیری عمیق (n=56) و یادگیر جمعی یا ترکیبی (n=56) بودند (شکل ۸). شکل ۹ توزیع تکنولوژیهای ML را نشان میدهد که حداقل سه دسته مدل براساس هر یک از فناوریها هستند.
شکل ۷. طبقهبندی تکنیکهای ML: ANN: شبکه عصبی مصنوعی، CNN: شبکه عصبی کانولوشن یا پیچشی، DNN: شبکه عصبی عمیق، RNN: شبکه عصبی بازگشتی، DBSCAN: خوشهبندی فضایی مبتنی بر چگالی برنامههای کاربردی با نویز، YOLO: شما فقط یکبار نگاه میکنید، MLPNN: شبکه عصبی پرسپترون چند لایه، CART: طبقهبندی و درخت رگرسیون، ID3: دوگانگی تکراری 3، QUEST: الگوریتمهای آماری موثر سریع بدون تعصب یا الگوریتمهای آماری سریع، نااریب و کارا.
مدل ML مورد استفاده برای اهداف خاص در معدن کاوی
ما موارد مرحله دو را در استخراج با ۱۲ مدل ML مقایسه کردیم و فراوانی استفاده از مدلها در هر زمینه را بررسی کردیم. در اکتشاف و هدفگذاری موادمعدنی، روشهای ترکیبی و درخت تصمیمگیری به طور گسترده در برنامهریزی و ارزیابی معدن مورد استفاده قرار گرفتند. یادگیری عمیق در درجه اول در حفاری و آتشکاری، مدیریت تجهیزات، ترکیبی در مدیریت ژئوتکنیکی و معدنکاری ایمن مورد استفاده قرار گرفت. در چندین مورد، VMها در نظارت بر پوشش گیاهی و ارزیابی خطرات معدن مورد استفاده قرار گرفتند. در مرحله سوم فرآیند استخراج، روشهای ترکیبی، یادگیری عمیق و SVM به ترتیب در مرحله اکتشافات، مرحله استخراج (عملیات بهرهبرداری) و مرحله بازسازی مورد استفاده قرار گرفتند (شکل ۱۰).
RQ3: ارزیابی مدل یادگیری ماشین
دادههای ارزیابی مدل
دادهها برای ارزیابی عملکرد مدلهای ML مورد نیاز بودند. پس از آموزش یک مدل ML، دادهها برای ارزیابی دقت مدل ارائه شدند؛ این دادهها شامل دادههای آموزشی برای تحقق ML، دادههای اعتبارسنجی و دادههای آزمون است دادههای اعتبار سنجی برای اهداف صحت سنجی به منظور انتخاب مناسبترین مدل در میان تمام مدلهای ML استفاده میشوند. دادههای آزمون برای تعیین این که مدل ML انتخاب شده چقدر خوب کار میکند استفاده میشود (۱۳۱). دادههای مورد استفاده برای ارزیابی مدل در ۷۵ مطالعه مورد استفاده قرار گرفت (شکل ۱۱). در نهایت، برای اندازهگیری عملکرد مدل، معیارهای ارزیابی مورد استفاده قرار گرفتند.
معیارهای ارزیابی مدل
معیارهای ارزیابی برای مقایسه و ارزیابی مدل ML توسعهیافته و تکنیکهای آماری مختلف استفاده میشوند. شاخصهای ارزیابی به هدف مدل ML بستگی دارند. مدلهای ML مورد استفاده برای طبقهبندی (به عنوان مثال، پیشبینی تولید سنگ معدن و استفاده از سنگ شکن (۷۶) و پیشبینی پرتاب سنگ در عملیات انفجار معدن روباز (۵۷))، به طور کلی از نظر ویژگی / سطح عملیاتی گیرنده تحت منحنی (AUC) یا ماتریس درهمریختگی ارزیابی میشوند.
مدلهای مرتبط با رگرسیون (به عنوان مثال، برای برآورد هزینه یک معدن، هزینه با استفاده از متغیرهای مختلفی مانند ظرفیت معدن و فاصله از راهآهن (۴۳، ۴۴) به طور کلی از نظر خطای میانگین مربعات (MSE)، خطای مطلق میانگین (MAE)، یا ضریب تعیین (R) (۲) ارزیابی میشوند. با این حال، چندین مطالعه از معیارهای ارزیابی مشابه بدون در نظر گرفتن هدف مدل ML استفاده کردهاند، همانطور که در شکل ۱۲ نشان داده شده است.
در مجموع ۳۰ ماتریس ارزیابی مورد استفاده قرار گرفت: پوشش، مقدار پیشبینی منفی، مقدار پیشبینی مثبت، ویژگی، حساسیت، پشتیبانی، همبستگی پیرسون، خطای مطلق نسبی، خطای میانگین مربعات یا MSE، اختلاف مطلق میانگین، حداقل خطای میانگین مربعات، خطای کسری، خطای نسبی، نمره مهارت احتمال رتبه، خطای جذر میانگین مربعات (RMSE)، خطای مطلق میانگین یا MAE، معیار اف یا F-measure، دقت، امتیاز اف 1 یا F1-score، سطح زیر منحنی یا AUC، ضریب کاپا، دقت، R، رگرسیون انطباقی چند متغیره، فراوانی آللهای متغیر، خطای مطلق میانگین، میانگین درصد خطای مطلق و خطای جذر میانگین مربعات.
شکل ۱۲. مطالعاتی که از اندازهگیریهای عملکرد مختلف استفاده میکنند (RAE: خطای مطلق نسبی؛ MSE: خطای میانگین مربعات، MAD: اختلاف مطلق میانگین، LMSE: حداقل میانگین مربع، RPSS: نمره مهارت احتمال رتبه، RMSE: خطای جذر میانگین مربعات، MAE: خطای مطلق میانگین، AUC: سطح زیر منحنی، R: ضریب تعیین، MARE: اسپلاین رگرسیون انطباقی چند متغیره، VAF: فراوانی آللهای متغیر، MEE: خطای مطلق میانگین، MASE: خطای مطلق.
در مجموع ۳۴ تحقیق از RMSE استفاده کردند و آن را به روشی با بیشترین تعداد کاربرد تبدیل کردند که پس از آن R، دقت، MAE و AUC قرار داشتند. یک پیشبینی ایدهآل باR =1.0، RMSE و MAE =0 و AUC =1.0 (۱۳۲) نشان داده میشود.
نتایج معیارهای ارزیابی هر مدل ML از پنج شاخص ارزیابی مورد استفاده در چندین مطالعه با استفاده از نمودار جعبه ای خلاصه شده است (در شکل ۱۳ – ۱۷ نشان داده شده است). این امر ما را قادر میسازد تا معیارهای ارزیابی کلی تکنیکهای ML را تجزیه و تحلیل کنیم.
از نظر RMSE، یادگیری عمیق با میانگین ۰.۰۰۰۶۰۸ محاسبه شده براساس ۳۴ مطالعه و به دنبال آن مدلهای SVM و گروهی، بهترین عملکرد را داشته است. با این حال، مدلی که بدترین عملکرد را نشان داد یادگیری عمیق بود براساس ۳۵ مقاله با استفاده از R، SVM با میانگین ۰.۹۹۶ بهترین عملکرد را داشت و پس از آن یادگیری گروهی و عمیق قرار داشت
براساس ۲۵ مطالعهای که در آنها شاخص ارزیابی دقت بود، SVM با میانگین ۱.۰ بهترین عملکرد را داشت و پس از آن یادگیری گروهی و عمیق قرار داشت. براساس ۲۲ مقاله با در نظر گرفتن MAE، یادگیری عمیق بهترین عملکرد را با میانگین ۰.۰۰۹ و پس از آن SVM و رگرسیون نشان داد. در ۱۱ مقاله با در نظر گرفتن AUC، بهترین مدل با میانگین ۰.۹۶ و به دنبال آن درخت تصمیم و بیزی بود.
نتیجهگیری
بررسیهای سیستماتیک برای بررسی روندهای فعلی در تحقیق ML مربوط به صنعت معدن و تجزیه و تحلیل مطالعات قبلی در زمینههای موضوعی خاص انجام شد. این بررسی یک مرور کلی از تحقیقات انجام شده تاکنون و کمک به تحقیقات آینده را فراهم میکند.
پاسخ به سوالات تحقیق به صورت زیر خلاصه میشود:
- مطالعات متعددی از سال ۲۰۱۸ انجام شده است و بیشترین تعداد مطالعات در بخش حفاری و آتشکاری در مرحله استخراج (عملیات بهرهبرداری) انجام شده است.
- این تحقیق با استفاده از داده منبع باز انجام شد. یادگیری سریع، عمیق و SVM به ترتیب به طور گسترده در زمینههای اکتشافات، استخراج و بازسازی مورد استفاده قرار گرفتهاند.
- مدل ML با استفاده از دادههای آزمون ارزیابی شد و معیارهای ارزیابی مورد استفاده RMSE، R، دقت، MAE و AUC بودند.
از سال 2018، مطالعات متعددی در مورد تکنیکهای ML در صنعت معدن انجام شده است، که نشان میدهد تحقیقات مربوط به ML مورد توجه خوبی قرار گرفته است. علاوه بر این، این واقعیت که تحقیق به طور فعال در زمینههای حفاری و آتشکاری انجام میشود، نشان میدهد که مقدار زیادی از دادههای مربوطه در حال حاضر در دسترس هستند.
ما از داده منبع باز استفاده کردیم که به دست آوردن آن نسبتا آسان است. داده منبع باز براساس تکنیکهای ML میتواند به راحتی توسط محققان در دسترس قرار گیرد. یک مدل ML میتواند به طور موثر با در نظر گرفتن هدف تحقیق برای بهبود عملکرد مدل انتخاب شود.
یادگیری سریع، عمیق و SVM معمولا مورد استفاده قرار میگیرند، زیرا این مدلها را میتوان با توجه به هدفشان به روشهای مختلف پیکربندی کرد. برای ارزیابی عملکرد مدل ML، یک شاخص ارزیابی میتواند با توجه به هدف مطالعه انتخاب شود. اگر هدف کاهش خطا است، میتوانید RMSE و MAE را انتخاب کنید؛ برای ارزیابی دقت، accuracy و AUC را میتوانید انتخاب کنید؛ و برای مقایسه عملکرد مدل، R را میتوانید استفاده کنید.