بررسی سیستماتیک کاربردهای یادگیری ماشینی در معدن

Telegram-logo
Instagram-logo
Baner-MineJobs
بررسی سیستماتیک کاربردهای یادگیری ماشینی در معدن
5/5 - (4 امتیاز)

https://www.mining-eng.ir/?p=10613

فهرست مطالب

بررسی سیستماتیک کاربردهای یادگیری ماشینی در معدن

پیشرفت‌های اخیر در فناوری معدنکاری هوشمند، تولید، جمع‌آوری و به اشتراک گذاری مقدار زیادی از داده‌ها را در زمان واقعی امکانپذیر نموده است. بنابراین، تحقیق به‌کارگیری یادگیری ماشین (‏Machine Learning) ‏که از این داده‌ها استفاده می‌کند به طور چشمگیری در صنعت معدن انجام می‌شود. در این مطالعه، ما ۱۰۹ مقاله تحقیقاتی را که در طی چند دهه گذشته انجام شده است مرور کردیم، که این مقالات در مورد تکنیک‌های ML برای اکتشافات معدن، استخراج (عملیات بهره‌برداری)، و بازسازی معدن بحث می‌کنند. روندهای تحقیق، مدل‌های ML و روش‌های ارزیابی که در ابتدا در ۱۰۹ مقاله به کار رفته بودند به طور سیستماتیک تجزیه و تحلیل شدند. نتایج نشان داد که مطالعات یادگیری ماشین به طور فعال در صنعت معدن از سال ۲۰۱۸، عمدتا برای اکتشاف مواد معدنی انجام شده‌ است. در میان مدل‌های ML، ماشین بردار پشتیبان بیش‌ترین استفاده را داشت، که با مدل‌های یادگیری عمیق دنبال می‌شد. مدل‌های ML عمدتا از نظر ریشه میانگین مربع خطا و ضریب تعیین ارزیابی شدند.

 

مقدمه

انسان‌ها به دلیل توانایی تفکر خود از زندگی روزمره خود درس هایی را می‌گیرند. به عنوان مثال، آن‌ها می‌توانند از آموزش و یا از افکار و خاطرات خود یاد بگیرند. با این حال، کامپیوترها بر خلاف انسان‌ها از طریق الگوریتم‌ها یاد می‌گیرند. این یادگیری ماشین (Machine Learning) ‏نامیده می‌شود. ML از الگوریتم‌های کامپیوتری برای شبیه‌سازی یادگیری انسان استفاده می‌کند و به کامپیوترها اجازه می‌دهد تا دانش را از دنیای واقعی شناسایی و به دست آورند، در نتیجه عملکرد برخی از وظایف را بر اساس دانش به دست آمده بهبود می‌بخشد. دقیقا، ML به صورت زیر تعریف می‌شود: “گفته می‌شود یک برنامه کامپیوتری از تجربه E مربوط به کلاس خاصی از وظایف T و اندازه‌گیری عملکرد P یاد می‌گیرد، اگر عملکرد آن در وظایف T، همانطور که توسط P اندازه‌گیری می‌شود، با تجربه E بهبود یابد” (‏۱)‏. اگرچه مفاهیم اولیه ML از دهه ۱۹۵۰ آغاز شد، ML در دهه ۱۹۹۰ به عنوان یک حوزه مستقل در نظر گرفته شد (‏۱).‏ الگوریتم‌های ML در زمینه‌های کامپیوتر (‏۲، ۳)‏، سلامت (‏۴)‏، محیط‌زیست (‏۵)‏، پزشکی (‏۶، ۷)‏، انرژی (‏۸)‏ و خدمات (‏۹)‏ استفاده می‌شوند.

معدنکاری هوشمند در صنعت معدن در نظر گرفته می‌شود. فناوری معدنکاری هوشمند، معرفی فناوری اطلاعات و ارتباطات لبه برش، مانند اینترنت اشیا (‏IoT)‏، کلان داده‌ها (بیگ دیتا)، موبایل، هوش مصنوعی (AI)‏، واقعیت افزوده، و واقعیت مجازی، در زمینه توسعه منابع معدنی است (‏۱۰)‏. به دلیل توسعه فناوری‌های معدنکاری هوشمند، حجم زیادی از داده‌ها در حال تولید، جمع‌آوری و به اشتراک‌گذاری در زمان واقعی هستند. در دسترس بودن داده‌های مختلف مانند داده‌های حفاری، داده‌های دریافتی از حسگرها، و توسعه داده‌های اندازه‌گیری تکنیک‌های AI، پیشرفت مهارت‌های محاسباتی کامپیوترها، و ML توجه را به علم داده در زمینه معدن جمع‌آوری کرده ‌است.

پروژه‌های مختلفی برای اعمال ML در سایت‌های معدن در حال اجرا هستند. برای به دست آوردن ذخایر طلای بیشتر از معدن رد لیک در کانادا، زمین‌شناسان در گولدکورپ از ابرکامپیوترهای هوش مصنوعی IBM برای تفسیر داده‌های اکتشاف و سپس کشف موادمعدنی جدید استفاده کردند (‏۱۱، ۱۲)‏. تولیدکنندگان تجهیزات سنگین برای ساخت‌وساز و معدن، مانند کوماتسو و NVIDIA، پروژه‌های مشترکی را برای کمک به شناسایی کارگران و تجهیزات در سایت‌های معدن پیاده کردند. فناوری‌های توسعه‌یافته می‌توانند تجهیزات ناکارآمد را شناسایی کنند و کارگران را ایمن نگه دارند (‏۱۳)‏. نیوتراکس، شرکتی که خدمات سیستم مدیریت ایمنی و عملیاتی را در معادن زیرزمینی فراهم می‌کند، و IVADO، یک موسسه تحقیقاتی هوش مصنوعی کانادایی، در پروژه‌های آزمایشی برای جمع‌آوری کلان داده‌ها از سنسورهای نصب‌ شده در تجهیزات معدن، تجزیه و تحلیل داده‌ها از طریق ML برای پیش‌بینی زمانی که تجهیزات معدن از کار می‌ایستند (خراب می‌شوند) و نیاز به نگهداری دارند، همکاری می‌کنند (‏۱۴، ۱۵)‏.

در (‏۱۶ – ۱۹)‏، برنامه‌های ML برای پردازش موادمعدنی و همچنین فناوری محاسبات نرم در اکتشاف، روندهای دیجیتالی سازی در صنعت معدن، و اتوماسیون در بخش معدن بررسی شده‌اند. با این حال، این مطالعه فاقد یک بررسی سیستماتیک از برنامه‌های ML در معدن است، که شامل اکتشافات معدن، استخراج (عملیات بهره‌برداری)، و بازسازی معدن است.

بنابراین، این مطالعه به طور سیستماتیک روش‌های مورد استفاده توسط پروژه‌های تحقیقاتی ML و پیاده‌سازی آن‌ها در زمینه استخراج را بررسی می‌کند/ روند تحقیق ML، مدل‌های ML و معیارهای ارزیابی مدل ML استفاده ‌شده در پروژه‌های تحقیقاتی به طور عمده بررسی می‌شوند. لازم به ذکر است که پروژه‌های تحقیقاتی ML برای پردازش موادمعدنی در این مطالعه مورد توجه قرار نگرفت زیرا بررسی‌های آنها قبلاً در مقالات ارائه شده بود (16).

 

روش‌های بررسی سیستماتیک

مرور مطالب یا بررسی سیستماتیک (‏اغلب به عنوان مرور سیستماتیک نامیده می‌شود) ‏شناسایی، ارزیابی، و تفسیر تمام تحقیقات در دسترس مربوط به یک سوال پژوهشی خاص، موضوع، یا یک پدیده را تسهیل می‌کند (‏۲۰)‏. این بررسی در نظر دارد راه‌حل‌هایی برای سوالات مرتبط با تحقیق ارائه دهد.

در این مطالعه، سوالات تحقیق در ابتدا برای تعریف دامنه و اهداف کلی تجزیه و تحلیل سازماندهی شدند. پس از آن، یک روش جستجو برای یافتن کارآمد مقالات تحقیقاتی مرتبط با سوالات تحقیق طراحی شد، که با ایجاد استانداردهایی برای انتخاب مطالعات مناسب از نتایج جستجو دنبال شد. سپس چکیده و نتایج مقالات برای یافتن ارتباط آن‌ها در زمینه تحقیق مورد بررسی قرار گرفت. این فرآیند با استخراج داده‌ها از مقاله برای تشخیص و ساختاربندی اطلاعات مربوطه به شرح زیر دنبال شد:

  • RQ1: روند تحقیقات ML در صنعت معدن چیست؟ (سالانه، منابع انتشار، زمینه‌های کاربردی دقیق)
  • RQ2: کدام مدل‌های ML در تحقیق شما استفاده شدند؟ (‏نوع داده، کلان داده‌ها، فرکانس استفاده از مدل، کاربرد دقیق در زمینه)‏
  • RQ3: شما چگونه مدل‌های ML را ارزیابی کردید؟ (‏داده‌های ارزیابی مدل، معیارهای ارزیابی، تعیین نتایج ارزیابی توسط مدل‌ها)‏

هدف اصلی این بررسی گزارش وضعیت فعلی استفاده ML در بخش معدن بود. سوالات تحقیق با توجه به هدف انتخاب شدند.RQ1 با هدف توصیف گرایش‌ها در تحقیقات ML در زمینه معدن است. این مقاله با ملاحظه به وضعیت فعلی انتشار پایان‌‌نامه سالانه و کاربردهای دقیق آن‌ها در این زمینه اشاره می‌کند. RQ2 مدل ML استفاده‌ شده در مطالعه را طبقه‌بندی می‌کند. به طور خاص، به نوع داده‌های یادگیری، استفاده از مقدار زیادی از داده‌ها، و فرکانس استفاده از مدل و کاربرد دقیق آن در این زمینه اشاره می‌کند. RQ3 ارزیابی مدل‌های ML را تحلیل می‌کند. به طور مفصل، به داده‌های ارزیابی مدل ML، معیارهای ارزیابی، و نتایج ارزیابی توسط مدل اشاره می‌کند.

 

روش جستجو

ما از گوگل و اسکوپوس به عنوان موتورهای جستجو استفاده کردیم. ما واژه‌های کلیدی جستجو مربوط به موضوع این بررسی را استخراج کردیم: معدن، موادمعدنی، یادگیری ماشینی، یادگیری عمیق، معدن روباز، معدن زیرزمینی. کلمات کلیدی، یادگیری ماشین و یادگیری عمیق، برای پیدا کردن مقالاتی استفاده شدند که از ML و روش‌های یادگیری عمیق در میان روش‌های مختلف تحقیق استفاده می‌کنند. بقیه کلمات کلیدی زمینه را تعریف کردند. برای تجزیه و تحلیل روند تحقیقات در دهه گذشته، تنها پروژه‌های تحقیقاتی که بین ژانویه ۲۰۱۱ و سپتامبر ۲۰۲۰ انجام شدند در نظر گرفته شدند. ما با استفاده از روش توصیفی، ۲۶۴ مقاله منتخب را به دست آوردیم.

 

معیارهای انتخاب

مقالات منتشر شده را می‌توان با معیارهای اصالت، نفوذ بالا، و استانداردهای بالا در نظر گرفت. این امر به این دلیل است که چنین نسخه‌های خطی توسط کارشناسان بررسی می‌شوند و سپس براساس آن قبل از انتشار تجدید نظر می‌شوند. بنابراین، ما مقالات منتشر شده را انتخاب کرده‌ایم. معیارهای انتخاب به شرح زیر بودند: (‏۱) ‏مقالات تحقیقاتی؛ (‏۲) ‏متن کامل؛ (‏۳)‏ حذف مقالات فرآوری موادمعدنی. این معیارها نیز به خاطر دلایل زیر انتخاب شدند: تنها مقالات تحقیقاتی برای تجزیه و تحلیل وضعیت فعلی ML استفاده شدند، و متن کامل یک تجزیه و تحلیل دقیق از محتوای مقاله را ممکن کرد. فرآوری موادمعدنی حذف شد زیرا چند مطالعه اخیر در مورد کاربردهای ML در فرآوری موادمعدنی بررسی و منتشر شده بودند (16).

پایگاه‌ داده نتایج جستجو شامل ۲۶۳ مقاله بود. به دلیل معیار اول، تعداد مقالات مرتبط به ۲۵۱ کاهش یافت. معیار دوم تعداد را به ۲۴۹ کاهش داد. پس از سه مرحله، همان طور که در شکل ۱ نشان ‌داده شده‌ است، ۱۰۹ مقاله انتخاب شدند.

شکل ۱. نمودار جریان فرآیند انتخاب
شکل ۱. نمودار جریان فرآیند انتخاب

 

نتایج بررسی

RQ1: روندهای تحقیقاتی یادگیری ماشین در صنعت معدن

سال انتشار

برای بررسی روند تحقیق، ما تصمیم گرفتیم که سال انتشار مقالات تحقیقاتی را به عنوان یک گام اولیه بررسی کنیم. شکل ۲ توزیع تحقیقات را از ژانویه ۲۰۱۱ تا سپتامبر ۲۰۲۰ نشان می‌دهد. این روند افزایشی شدید را در سه سال گذشته نشان می‌دهد. می‌توان مشاهده کرد که ۵۱ مقاله از ۱۰۹ مقاله قبل از سال ۲۰۱۸ مورد مطالعه قرار گرفتند. تعداد مطالعات انجام‌ شده در سال‌های ۲۰۱۸، ۲۰۱۹ و سپتامبر ۲۰۲۰ به ترتیب ۱۸، ۲۸ و ۱۲ بوده‌ است. در سال ۲۰۱۸، تعداد مقالات منتشر شده سه برابر بیشتر از سال قبل بود. تحقیقات انجام‌ شده در سه سال گذشته حدود ۵۳% از کل تحقیقات انجام‌ شده در ده سال گذشته را تشکیل می‌دهند.

شکل ۲. انتشارات در هر سال (‏ژانویه ۲۰۱۱ سپتامبر ۲۰۲۰)
شکل ۲. انتشارات در هر سال (‏ژانویه ۲۰۱۱ سپتامبر ۲۰۲۰)

 

منبع انتشار

مقالات تحقیقاتی متعددی در مجلات مختلف منتشر شده‌اند. جدول ۱ جزئیات نشریات در مجلات برتر را به همراه تعداد مقالات منتشر شده خلاصه می‌کند. بیشترین تعداد مقالات در تحقیقات منابع طبیعی، زمین‌شناسی کاربردی مجدد علوم و به دنبال آن مقالات دیگر یافت شد.

جدول ۱. خلاصه نشریات برتر
جدول ۱. خلاصه نشریات برتر

 

زمینه‌های کاربردی دقیق

ما زمینه‌های مربوط به تحقیقات فعال را مورد تجزیه و تحلیل قرار دادیم. برای طبقه‌بندی کار، یک نقشه فنی از بخش معدن تهیه شد. مرحله اول شامل سه مرحله از فرآیند استخراج بود که اکتشاف، بهره‌برداری و احیای معدن بودند. هر آیتم با جزئیات طبقه‌بندی شد. مرحله دوم شامل اکتشاف موادمعدنی و هدف‌گذاری ، و ارزیابی و برنامه‌ریزی معدن تحت فاز اکتشافات بود. مرحله استخراج (عملیات بهره‌برداری) به عنوان حفاری و آتشکاری، مدیریت تجهیزات، مدیریت ژئوتکنیکی و معدنکاری ایمن طبقه‌بندی شد. مرحله بازسازی به پوشش گیاهی (‏مانیتورینگ)‏ و خطرات معدن (‏ارزیابی) ‏تقسیم شد. در مرحله سوم، ما زمینه‌های مرتبط را تحت آیتم مرحله دوم اضافه کردیم. همان طور که در شکل ۳ نشان ‌داده شده ‌است، با استفاده از ۱۰۹ مقاله، میدان معدنی را به ۳۴ میدان تقسیم کردیم.

شکل ۳. زمینه‌های کاربرد تحقیق
شکل ۳. زمینه‌های کاربرد تحقیق

 

در مرحله اول طبقه‌بندی فرآیند استخراج، ۵۹ مطالعه در مرحله استخراج (عملیات بهره‌برداری) انجام شد (‏در شکل ۴ نشان ‌داده شده ‌است).‏ شکل ۵ وضعیت تحقیق آیتم‌ها را در مرحله سوم طبقه‌بندی نشان می‌دهد. در مجموع ۱۱ مطالعه مربوط به مدلسازی و نقشه‌برداری ذخیره کانسار، ۱۰ مطالعه مربوط به پیش‌بینی لرزش زمین در زمینه استخراج و ۶ مطالعه مربوط به آلودگی آب و خاک در مرحله بازسازی انجام شد.

شکل ۴. تعداد مطالعات مبتنی بر مطالعه زمینه‌های کاربردی
شکل ۴. تعداد مطالعات مبتنی بر مطالعه زمینه‌های کاربردی
شکل ۵. نمودار تفصیلی تعداد مقالات را نشان می‌دهد.
شکل ۵. نمودار تفصیلی تعداد مقالات را نشان می‌دهد.

 

وضعیت تحقیق هر زمینه به عنوان عناصر مرحله دوم مورد بررسی قرار گرفت. در زمینه اکتشاف و هدف قرار دادن موادمعدنی، یک مطالعه تشخیص ناهنجاری ژئوشیمیایی (‏۲۱)‏ که از داده‌های اکتشافی برای تشخیص ناهنجاری‌های ژئوشیمیایی استفاده می‌کند، انجام شد. مطالعات نقشه‌برداری زمین‌شناسی (‏۲۲ – ۲۴) ‏با استفاده از ویژگی‌های سنگ‌ها انجام شد. تجزیه و تحلیل موادمعدنی (‏۲۵ – ۳۱) ‏با استفاده از داده‌های حفاری یا نمونه‌ها انجام شد. یک مطالعه مدلسازی و نقشه‌برداری اکتشاف موادمعدنی (‏۳۲ – ۴۲)‏ برای ارزیابی پتانسیل موادمعدنی با استفاده از داده‌های اکتشاف انجام شد.

در حوزه‌های برنامه‌ریزی و ارزیابی معدن، تحقیق بر روی برآورد هزینه (‏۴۳، ۴۴) ‏به منظور پیش‌بینی هزینه‌های عملیات معدن و برنامه‌ریزی معدن (‏۴۵، ۴۷)‏ به منظور بهینه‌سازی طراحی معدن انجام شد. برآورد ذخیره (‏۴۹، ۴۸) ‏تحقیقی انجام شد که ذخایر و ارزش‌های اقتصادی مورد نیاز برای عملیات معدن را در نظر می‌گرفت.

در موارد حفاری و آتشکاری، پیش‌بینی فشار هوا (‏۵۰، ۵۱)‏، پیش‌بینی شکست یا عقب‌زدگی (‏۵۲، ۵۴)‏، پیش‌بینی پرتاب سنگ (‏۵۵، ۵۸)‏، پیش‌بینی پرتاب‌سنگ و پیش‌بینی فشار هوا (‏۵۹)‏، پیش‌بینی لرزش زمین (‏۶۰، ۶۹) ‏و برآورد خردشدگی سنگ (‏۷۰)‏ برای بررسی تغییرات در فشار هوا، ارتعاش، بنا یا بقعه و لرزش ایجاد شده در حین حفاری و آتشکاری انجام شد. یک مطالعه پیش‌بینی آسیب (‏۷۲، ۷۱) ‏انجام شد، که در آن آسیب ناشی از آتشکاری یک معدن روباز به نواحی مسکونی اطراف پیش‌بینی شد (‏۷۱)‏.

در مقوله مدیریت تجهیزات، یک مطالعه تشخیص خطا (‏۷۳، ۷۴)‏ انجام شد که نقص تجهیزات را تشخیص داد. عملیات حمل و نقل (‏۷۹ / ۷۵) ‏و ناوبری (‏۸۰) ‏به ترتیب برای بهینه‌سازی وسایل حمل و نقل، مانند کامیون‌ها و لودر، و برای نشان دادن حالت حمل و نقل تجهیزات انجام شد. مطالعه نگهداری و تعمیرات پیشگویانه (‏۸۱)‏ به منظور افزایش بهره‌وری عملیات معدن با پیش‌بینی شکست یا خرابی تجهیزات انجام شد.

در دسته مدیریت ژئوتکنیکی، تکنیک پیش‌بینی پایداری ستون (‏۸۲)‏ پایداری ستون‌های زیرزمینی معدن را پیش‌بینی می‌کند. پیش‌بینی انفجار سنگ (‏۸۳ – ۸۵)‏ برای طبقه‌بندی و پیش‌بینی انفجار سنگ‌ها با استفاده از مشخصات و داده‌های زمانی سنگ‌های منفجر شده انجام شد. مطالعات مدیریت شیب (‏۸۶ – ۹۰) ‏برای پیش‌بینی تغییر شکل شیب معدن و ارزیابی پایداری آن انجام شد. طراحی دامپ باطله (‏۹۱ – ۹۳)‏، طراحی و استحکام محل دفن را پیش‌بینی می‌کند.

در مورد معدنکاری ایمن، مطالعه‌ای بر روی کنترل زه‌کشی (‏۹۴ – ۹۷) برای پیش‌بینی سطح آب زیرزمینی یا جریان ورودی معادن انجام شد. مطالعات کنترل گرد و غبار، کیفیت هوای معادن را ارزیابی و پیش‌بینی کردند (‏۹۸ – ۱۰۰)‏. یک مطالعه وقوع زلزله (‏۱۰۱،۱۰۲) ‏را با در نظر گرفتن داده‌های زمانی افزایش فعالیت لرزه‌ای در معادن زغال‌سنگ پیش‌بینی کرد. یک مطالعه کنترل گاز (‏۱۰۳ – ۱۰۵)‏ برای پیش‌بینی تولید گازهای خطرناک در معادن انجام شد. مطالعاتی در مورد ایمنی شغلی (‏۱۰۶،۱۰۷)‏ وجود داشت که تجهیزات را کشف و احتمالات تصادف را پیش‌بینی می‌کرد، در نتیجه از حوادث جلوگیری می‌کرد و طراحی تهویه مناسب را تسهیل می‌کرد (‏۱۰۸)‏.

در حوزه تشخیص پوشش گیاهی، مطالعات تشخیص تغییرات (‏۱۰۹ – ۱۱۳)‏ و نقشه‌برداری پوشش گیاهی (‏۱۱۴ – ۱۱۷)‏ به ترتیب برای تشخیص پوشش گیاهی که در طول عملیات معدن تغییر کرده ‌است و طبقه‌بندی ترکیب سطح انجام شد.

در بخش ارزیابی خطرات معدن، یک مطالعه ارزیابی زیست‌محیطی (‏۱۱۸)‏ کیفیت محیطی جغرافیایی را ارزیابی و طبقه‌بندی کرد. مطالعه‌ای برای پیش‌بینی و ارزیابی آلودگی خاک و آب (‏۱۲۴ – ۱۲۹)‏ ناشی از عملیات معدن انجام شد.

 

RQ2: مدل‌های یادگیری ماشین

نوع مجموعه داده

چندین مجموعه داده در مطالعات ML استفاده شده‌اند. داده‌ها یا از منابع باز قابل‌دسترس عمومی و یا به صورت جداگانه در مورد داده‌های خصوصی به دست آمدند. بنابراین، داده‌ها به داده‌هایی طبقه‌بندی می‌شوند که می‌توانند به طور مستقیم در این زمینه مورد استفاده قرار گیرند، داده‌هایی که باید در این زمینه به دست آیند و پس از آن یک پردازش آزمایشگاهی قرار گیرند و بعدا می‌توانند به صورت عمومی مورد استفاده قرار گیرند. مجموعه‌های داده منبع باز مورد استفاده به صورت عمومی در دسترس هستند و یا در ماهیت خصوصی هستند (‏مانند RapidEye، NASA و Minto) ‏(‏۲)‏. در یک مطالعه، تحقیق با استفاده از داده‌های مختلف انجام شد.

بنابراین، تعداد کل استفاده از داده‌ها ۱۲۱ مورد بود. بیش‌ترین تعداد داده‌های مورد استفاده، ۵۷ داده بود که که از منبع باز بدست آمده بود (شکل 6).

شکل ۶. نوع مجموعه داده
شکل ۶. نوع مجموعه داده

 

کلان داده

کلان داده معمولا از ۱ ترابایت تا ۱ پتابایت داده است و شامل داده ساختار یافته (‏برای مثال، جدول اعداد) ‏و داده ساختار نیافته (‏برای مثال، عکس و اسناد) ‏است (‏۱۳۰).‏ به عبارت دیگر، این یک تکنولوژی است که از داده‌های زیادی استفاده می‌کند. الگوریتم‌های ML، طبق تعریف، عملکرد خود را با دسترسی به داده‌های اضافی بهبود می‌بخشند (‏۸)‏. بنابراین، داده‌ها تحقیق شامل ML را تحت‌تاثیر قرار می‌دهد. مقدار زیادی از داده‌ها مفید هستند و می‌توانند به سایت‌ها و آزمایشگاه‌های مختلف اعمال شوند. بنابراین، ما مطالعاتی را در نظر گرفتیم که بحث یا نظری در مورد داده‌های بزرگ داشتند. جدول ۲ تعداد مطالعاتی را نشان می‌دهد که کلان داده‌ها را در نسخه‌های خطی خود شامل می‌شوند یا ذکر می‌کنند.

جدول ۲. فناوری‌های کلان داده
جدول ۲. فناوری‌های کلان داده

 

مدل‌های ML

براساس مقاله انتخاب ‌شده، مدل ML طبقه‌بندی شد. در یک مطالعه خاص، مطالعات از مدل‌های مختلفی برای مقایسه مدل‌ها استفاده کردند. در نتیجه تجزیه و تحلیل مطالعات، تعداد کل مدل‌های مورد استفاده ۲۵۵ مورد بود. این مدل‌ها در مجموع به ۱۲ نوع طبقه‌بندی شدند: یادگیری عمیق، یادگیر جمعی یا ترکیبی، خوشه‌بندی، کاهش ابعاد، الگوریتم‌های ژنتیک، شبکه عصبی، بیزین (قضیه بیزی)، درخت تصمیم‌گیری، مبتنی بر نمونه، رگرسیون، ماشین بردار پشتیبان (‏SVM)‏، و فرآیند گاوسی. شکل ۷ جزئیات طبقه‌بندی تکنیک ML را نشان می‌دهد. شکل ۸ بسامد استفاده از مدل‌های ML در مطالعه را نشان می‌دهد. رایج‌ترین مدل‌های مورد استفاده: ماشین بردار پشتیبان یا SVM (‏n=58)‏، یادگیری عمیق (‏n=56) ‏و یادگیر جمعی یا ترکیبی (‏n=56) ‏بودند (‏شکل ۸)‏. شکل ۹ توزیع تکنولوژی‌های ML را نشان می‌دهد که حداقل سه دسته مدل براساس هر یک از فناوری‌ها هستند.

Systematic review of machine learning applications in mining 9 1
Recent developments in smart mining technology have enabled the production, collection, and sharing of a large amount of data in real time. Therefore, research employing machine learning (ML) that utilizes these data is being actively conducted in the mining industry. In this study, we reviewed 109 research papers, published over the past decade, that discuss ML techniques for mineral exploration, exploitation, and mine reclamation. Research trends, ML models, and evaluation methods primarily discussed in the 109 papers were systematically analyzed. The results demonstrated that ML studies have been actively conducted in the mining industry since 2018, mostly for mineral exploration. Among the ML models, support vector machine was utilized the most, followed by deep learning models. The ML models were evaluated mostly in terms of their root mean square error and coefficient of determination.

شکل ۷. طبقه‌بندی تکنیک‌های ML: ANN: شبکه عصبی مصنوعی، CNN: شبکه عصبی کانولوشن یا پیچشی، DNN: شبکه عصبی عمیق، RNN: شبکه عصبی بازگشتی، DBSCAN: خوشه‌بندی فضایی مبتنی بر چگالی برنامه‌های کاربردی با نویز، YOLO: شما فقط یک‌بار نگاه می‌کنید، MLPNN: شبکه عصبی پرسپترون چند لایه، CART: طبقه‌بندی و درخت رگرسیون، ID3: دوگانگی تکراری 3، QUEST: الگوریتم‌های آماری موثر سریع بدون تعصب یا الگوریتم‌های آماری سریع، نااریب و کارا.

 

شکل ۸. فرکانس‌های کاربرد مدل‌های ML
شکل ۸. فرکانس‌های کاربرد مدل‌های ML

 

شکل ۹. توزیع کاربرد مدل ML دقیق
شکل ۹. توزیع کاربرد مدل ML دقیق

 

مدل ML مورد استفاده برای اهداف خاص در معدن کاوی

ما موارد مرحله دو را در استخراج با ۱۲ مدل ML مقایسه کردیم و فراوانی استفاده از مدل‌ها در هر زمینه را بررسی کردیم. در اکتشاف و هدف‌گذاری موادمعدنی، روش‌های ترکیبی و درخت تصمیم‌گیری به طور گسترده‌ در برنامه‌ریزی و ارزیابی معدن مورد استفاده قرار گرفتند. یادگیری عمیق در درجه اول در حفاری و آتشکاری، مدیریت تجهیزات، ترکیبی در مدیریت ژئوتکنیکی و معدنکاری ایمن مورد استفاده قرار گرفت. در چندین مورد، VM‌ها در نظارت بر پوشش گیاهی و ارزیابی خطرات معدن مورد استفاده قرار گرفتند. در مرحله سوم فرآیند استخراج، روش‌های ترکیبی، یادگیری عمیق و SVM به ترتیب در مرحله اکتشافات، مرحله استخراج (عملیات بهره‌برداری) و مرحله بازسازی مورد استفاده قرار گرفتند (‏شکل ۱۰)‏.

 

RQ3: ارزیابی مدل یادگیری ماشین

داده‌های ارزیابی مدل

داده‌ها برای ارزیابی عملکرد مدل‌های ML مورد نیاز بودند. پس از آموزش یک مدل ML، داده‌ها برای ارزیابی دقت مدل ارائه شدند؛ این داده‌ها شامل داده‌های آموزشی برای تحقق ML، داده‌های اعتبارسنجی و داده‌های آزمون است داده‌های اعتبار سنجی برای اهداف صحت سنجی به منظور انتخاب مناسب‌ترین مدل در میان تمام مدل‌های ML استفاده می‌شوند. داده‌های آزمون برای تعیین این که مدل ML انتخاب‌ شده چقدر خوب کار می‌کند استفاده می‌شود (‏۱۳۱)‏. داده‌های مورد استفاده برای ارزیابی مدل در ۷۵ مطالعه مورد استفاده قرار گرفت (‏شکل ۱۱)‏. در نهایت، برای اندازه‌گیری عملکرد مدل، معیارهای ارزیابی مورد استفاده قرار گرفتند.

 

معیارهای ارزیابی مدل

معیارهای ارزیابی برای مقایسه و ارزیابی مدل ML توسعه‌یافته و تکنیک‌های آماری مختلف استفاده می‌شوند. شاخص‌های ارزیابی به هدف مدل ML بستگی دارند. مدل‌های ML مورد استفاده برای طبقه‌بندی (‏به عنوان مثال، پیش‌بینی تولید سنگ معدن و استفاده از سنگ شکن (‏۷۶)‏ و پیش‌بینی پرتاب سنگ در عملیات انفجار معدن روباز (‏۵۷)‏)،‏ به طور کلی از نظر ویژگی / سطح عملیاتی گیرنده تحت منحنی (‏AUC)‏ یا ماتریس درهم‌ریختگی ارزیابی می‌شوند.

مدل‌های مرتبط با رگرسیون (‏به عنوان مثال، برای برآورد هزینه یک معدن، هزینه با استفاده از متغیرهای مختلفی مانند ظرفیت معدن و فاصله از راه‌آهن (‏۴۳، ۴۴)‏ به طور کلی از نظر خطای میانگین مربعات (‏MSE)‏، خطای مطلق میانگین (‏MAE)‏، یا ضریب تعیین (‏R) ‏(‏۲)‏ ارزیابی می‌شوند. با این حال، چندین مطالعه از معیارهای ارزیابی مشابه بدون در نظر گرفتن هدف مدل ML استفاده کرده‌اند، همان‌طور که در شکل ۱۲ نشان ‌داده شده ‌است.

در مجموع ۳۰ ماتریس ارزیابی مورد استفاده قرار گرفت: پوشش، مقدار پیش‌بینی منفی، مقدار پیش‌بینی مثبت، ویژگی، حساسیت، پشتیبانی، همبستگی پیرسون، خطای مطلق نسبی، خطای میانگین مربعات یا MSE، اختلاف مطلق میانگین، حداقل خطای میانگین مربعات، خطای کسری، خطای نسبی، نمره مهارت احتمال رتبه، خطای جذر میانگین مربعات (‏RMSE)‏، خطای مطلق میانگین یا MAE، معیار اف یا F-measure، دقت، امتیاز اف 1 یا F1-score، سطح زیر منحنی یا AUC، ضریب کاپا، دقت، R، رگرسیون انطباقی چند متغیره، فراوانی آلل‌های متغیر، خطای مطلق میانگین، میانگین درصد خطای مطلق و خطای جذر میانگین مربعات.

شکل ۱۰. برنامه‌های استخراج با پشتیبانی مدل‌های ML
شکل ۱۰. برنامه‌های استخراج با پشتیبانی مدل‌های ML

 

شکل ۱۱. ارزیابی مدل براساس نوع مجموعه داده
شکل ۱۱. ارزیابی مدل براساس نوع مجموعه داده

Systematic review of machine learning applications in mining 14 1

شکل ۱۲. مطالعاتی که از اندازه‌گیری‌های عملکرد مختلف استفاده می‌کنند (‏RAE: خطای مطلق نسبی؛ MSE: خطای میانگین مربعات، MAD: اختلاف مطلق میانگین، LMSE: حداقل میانگین مربع، RPSS: نمره مهارت احتمال رتبه، RMSE: خطای جذر میانگین مربعات، MAE: خطای مطلق میانگین، AUC: سطح زیر منحنی، R: ضریب تعیین، MARE: اسپلاین رگرسیون انطباقی چند متغیره، VAF: فراوانی آلل‌های متغیر، MEE: خطای مطلق میانگین، MASE: خطای مطلق.

 

در مجموع ۳۴ تحقیق از RMSE استفاده کردند و آن را به روشی با بیش‌ترین تعداد کاربرد تبدیل کردند که پس از آن R، دقت، MAE و AUC قرار داشتند. یک پیش‌بینی ایده‌آل باR =1.0، RMSE و MAE =0 و AUC =1.0 (‏۱۳۲)‏ نشان داده می‌شود.

نتایج معیارهای ارزیابی هر مدل ML از پنج شاخص ارزیابی مورد استفاده در چندین مطالعه با استفاده از نمودار جعبه ای خلاصه شده‌ است (‏در شکل ۱۳ – ۱۷ نشان‌ داده شده ‌است)‏. این امر ما را قادر می‌سازد تا معیارهای ارزیابی کلی تکنیک‌های ML را تجزیه و تحلیل کنیم.

از نظر RMSE، یادگیری عمیق با میانگین ۰.۰۰۰۶۰۸ محاسبه ‌شده براساس ۳۴ مطالعه و به دنبال آن مدل‌های SVM و گروهی، بهترین عملکرد را داشته ‌است. با این حال، مدلی که بدترین عملکرد را نشان داد یادگیری عمیق بود براساس ۳۵ مقاله با استفاده از R، SVM با میانگین ۰.۹۹۶ بهترین عملکرد را داشت و پس از آن یادگیری گروهی و عمیق قرار داشت

 براساس ۲۵ مطالعه‌ای که در آن‌ها شاخص ارزیابی دقت بود، SVM با میانگین ۱.۰ بهترین عملکرد را داشت و پس از آن یادگیری گروهی و عمیق قرار داشت. براساس ۲۲ مقاله با در نظر گرفتن MAE، یادگیری عمیق بهترین عملکرد را با میانگین ۰.۰۰۹ و پس از آن SVM و رگرسیون نشان داد. در ۱۱ مقاله با در نظر گرفتن AUC، بهترین مدل با میانگین ۰.۹۶ و به دنبال آن درخت تصمیم و بیزی بود.

شکل ۱۳. نمودارهای جعبه‌ای برای RMSE (خطای جذر میانگین مربعات) شکل ۱۴. نمودارهای جعبه‌ای برای R
شکل ۱۳. نمودارهای جعبه‌ای برای RMSE (خطای جذر میانگین مربعات) شکل ۱۴. نمودارهای جعبه‌ای برای R
شکل ۱۵. نمودارهای جعبه ای برای accuracy (دقت)
شکل ۱۵. نمودارهای جعبه ای برای accuracy (دقت)

 

شکل ۱۶. نمودارهای جعبه‌ای برای MAE (خطای مطلق میانگین
شکل ۱۶. نمودارهای جعبه‌ای برای MAE (خطای مطلق میانگین

 

شکل ۱۷. نمودار‌های جعبه ای برای AUC (سطح زیر منحنی)
شکل ۱۷. نمودار‌های جعبه ای برای AUC (سطح زیر منحنی)

 

نتیجه‌گیری

بررسی‌های سیستماتیک برای بررسی روندهای فعلی در تحقیق ML مربوط به صنعت معدن و تجزیه و تحلیل مطالعات قبلی در زمینه‌های موضوعی خاص انجام شد. این بررسی یک مرور کلی از تحقیقات انجام ‌شده تاکنون و کمک به تحقیقات آینده را فراهم می‌کند.

پاسخ به سوالات تحقیق به صورت زیر خلاصه می‌شود:

  • مطالعات متعددی از سال ۲۰۱۸ انجام شده ‌است و بیش‌ترین تعداد مطالعات در بخش حفاری و آتشکاری در مرحله استخراج (عملیات بهره‌برداری) انجام شده‌ است.
  • این تحقیق با استفاده از داده منبع باز انجام شد. یادگیری سریع، عمیق و SVM به ترتیب به طور گسترده در زمینه‌های اکتشافات، استخراج و بازسازی مورد استفاده قرار گرفته‌اند.
  • مدل ML با استفاده از داده‌های آزمون ارزیابی شد و معیارهای ارزیابی مورد استفاده RMSE، R، دقت، MAE و AUC بودند.

از سال 2018، مطالعات متعددی در مورد تکنیک‌های ML در صنعت معدن انجام شده است، که نشان می‌دهد تحقیقات مربوط به ML مورد توجه خوبی قرار گرفته است. علاوه بر این، این واقعیت که تحقیق به طور فعال در زمینه‌های حفاری و آتشکاری انجام می‌شود، نشان می‌دهد که مقدار زیادی از داده‌های مربوطه در حال حاضر در دسترس هستند.

ما از داده منبع باز استفاده کردیم که به دست آوردن آن نسبتا آسان است. داده منبع باز براساس تکنیک‌های ML می‌تواند به راحتی توسط محققان در دسترس قرار گیرد. یک مدل ML می‌تواند به طور موثر با در نظر گرفتن هدف تحقیق برای بهبود عملکرد مدل انتخاب شود.

یادگیری سریع، عمیق و SVM معمولا مورد استفاده قرار می‌گیرند، زیرا این مدل‌ها را می‌توان با توجه به هدفشان به روش‌های مختلف پیکربندی کرد. برای ارزیابی عملکرد مدل ML، یک شاخص ارزیابی می‌تواند با توجه به هدف مطالعه انتخاب شود. اگر هدف کاهش خطا است، می‌توانید RMSE و MAE را انتخاب کنید؛ برای ارزیابی دقت، accuracy و AUC را می‌توانید انتخاب کنید؛ و برای مقایسه عملکرد مدل، R را می‌توانید استفاده کنید.

 

دانلود منابع این مقاله

عاشق شروع کردن هستم، هنر من جنگیدن برای آرزوهام هست؛ دنبال این هستم که درک درستی از زندگی پیدا کنم و ازش لذت ببرم برای همین بیشترین سرمایه‌گذاری رو روی خودم می‌کنم.

جدیدترین مطالب رو در ایمیل خود دریافت کنید

این مطلب را با دوستان خود به اشتراک بگذارید

اشتراک در
اطلاع از
guest
0 نظرات
بازخورد (Feedback) های اینلاین
مشاهده همه دیدگاه ها
0
افکار شما را دوست داریم، لطفا نظر دهید.x
پیمایش به بالا

فرم گزارش

خواهشمند است، فرم را تکمیل و ارسال نمایید.

راهنمای دانلود

  • اگر نرم‌افزار مدیریت دانلود ندارید، قبل از دانلود هرگونه فایلی، یک نرم افزار مدیریت دانلود مانند IDM و یا FlashGet نصب کنید.
  • برای دانلود، به روی عبارت “دانلود” کلیک کنید و منتظر بمانید تا پنجره مربوطه ظاهر شود سپس محل ذخیره شدن فایل را انتخاب کنید و منتظر بمانید تا دانلود تمام شود.
  • در صورت بروز مشکل در دانلود فایل‌ها تنها کافی است در آخر لینک دانلود فایل یک علامت سوال ? قرار دهید تا فایل به راحتی دانلود شود.
  • فایل های قرار داده شده برای دانلود به منظور کاهش حجم و دریافت سریعتر فشرده شده‌اند، برای خارج سازی فایل‌ها از حالت فشرده از نرم‌افزار Winrar و یا مشابه آن استفاده کنید.
  • چنانچه در مقابل لینک دانلود عبارت بخش اول، دوم و … مشاهده کردید تمام بخش‌ها می‌بایستی حتماً دانلود شود تا فایل قابل استفاده باشد.
  • کلمه رمز جهت بازگشایی فایل فشرده عبارت www.mining-eng.ir می‌باشد. تمامی حروف را می بایستی به صورت کوچک تایپ کنید و در هنگام تایپ به وضعیت EN/FA کیبورد خود توجه داشته باشید همچنین بهتر است کلمه رمز را تایپ کنید و از Copy-Paste آن بپرهیزید.
  • چنانچه در هنگام خارج سازی فایل از حالت فشرده با پیغام CRC مواجه شدید، در صورتی که کلمه رمز را درست وارد کرده باشید. فایل به صورت خراب دانلود شده است و می‌بایستی مجدداً آن را دانلود کنید.