Автоматизоване машинне навчання

Автоматизо́ване маши́нне навча́ння (АвтоМН, англ. Automated machine learning, AutoML) — це процес автоматизації задач застосування машинного навчання до практичних задач. АвтоМН охоплює весь конвеєр від сирого набору даних до готової для розгортання моделі машинного навчання. АвтоМН було запропоновано як рішення на основі штучного інтелекту для все більших викликів застосування машинного навчання.^[1]^[2] Високий рівень автоматизації в АвтоМН дозволяє неекспертам використовувати моделі та методики машинного навчання не вимагаючи від них ставати експертами в машиннім навчанні. Автоматизація процесу застосування машинного навчання від початку до кінця додатково пропонує переваги створення простіших рішень, швидшого створення цих рішень, та моделей, які часто перевершують розроблені власноруч. АвтоМН використовували для порівнювання відносної важливості кожного з чинників у передбачувальній моделі.^[3]

Порівняння зі стандартним підходом

У типовім застосуванні машинного навчання, практики мають набір точок даних входу для застосування в тренуванні. Ці сирі дані можуть не бути в такому вигляді, до якого можливо застосовувати всі алгоритми. Щоби зробити ці дані придатними для машинного навчання, експертові може довестися застосувати відповідні методи попередньої обробки даних, конструювання ознак, виділяння ознак та обирання ознак. Після цих кроків практики мусять відтак виконати обирання алгоритму^[en] та оптимізацію гіперпараметрів, щоби максимізувати передбачувальну продуктивність своєї моделі. Кожен із цих кроків може виявлятися складним, спричинюючи значні перешкоди для використання машинного навчання.

АвтоМН різко спрощує ці кроки для неекспертів.

Цілі автоматизації

Автоматизоване машинне навчання може націлюватися на різні етапи процесу машинного навчання.^[2] Кроки для автоматизації:

Підготовка^[en] та подавання даних (з сирих даних та різних форматів)
- Виявляння типів^[en] стовпців, наприклад, булів, дискретний числовий, неперервний числовий, чи текстовий
- Виявляння призначення стовпців, наприклад, ціль/мітка, стратифікувальне поле, числова ознака, категорійна текстова ознака, чи вільнотекстова ознака
- Виявляння задачі, наприклад, бінарної класифікації, регресії, кластерування чи ранжування
Конструювання ознак
- Обирання ознак
- Виділяння ознак
- Метанавчання та передавальне навчання
- Виявляння та обробка асиметричності даних та/або пропущених значень
Обирання моделі
Оптимізація гіперпараметрів алгоритму навчання, та обозначування (англ. featurization)
Обирання конвеєра з урахуванням обмежень у часі, пам'яті та складності
Обирання оцінювальних метрик та процедур затверджування
Перевірка наявності проблем
- Виявляння витоків
- Виявляння помилок у конфігурації
Аналіз отримуваних результатів
Створення користувацьких інтерфейсів та унаочнень

Втілення

Відкриті

auto-sklearn, відкритий інструмент АвтоМН, втілений мовою Python, побудований навколо бібліотеки scikit-learn^[4]
AutoGluon, відкритий інструментарій АвтоМН Amazon, також доступний як шаблон AWS CloudFormation^[5]
TransmogrifAI, наскрізний інструментарій АвтоМН для структурованих даних, написаний мовою Scala, і який працює на Apache Spark^[6]
Neural Network Intelligence (NNI), відкритий інструментарій АвтоМН Microsoft^[7]

Комерційні

Azure ML, хмарна служба Microsoft Azure^[8]
Google Cloud AutoML, рішення АвтоМН на Google Cloud Platform^[9]
AutoAI в IBM Watson Studio^[en] для автоматизації підготовки даних, розробки моделей, конструювання ознак, та оптимізації гіперпараметрів^[10]
SDK Oracle Accelerated Data Science (ADS),^[11] бібліотека Python, що входить до служби Data Science^[12] інфраструктури Oracle Cloud^[en]

Див. також

Примітки

↑ Thornton C, Hutter F, Hoos HH, Leyton-Brown K (2013). Auto-WEKA: Combined Selection and Hyperparameter Optimization of Classification Algorithms. KDD '13 Proceedings of the 19th ACM SIGKDD international conference on Knowledge discovery and data mining. с. 847—855. Архів оригіналу за 28 липня 2020. Процитовано 15 листопада 2020. (англ.)
↑ ^а ^б Hutter F, Caruana R, Bardenet R, Bilenko M, Guyon I, Kegl B, and Larochelle H. AutoML 2014 @ ICML. AutoML 2014 Workshop @ ICML. Процитовано 28 березня 2018.{{cite web}}: Обслуговування CS1: Сторінки з параметром url-status, але без параметра archive-url (посилання) (англ.)
↑ Li R.Y.M., Chau K.W., Li H.C.Y., Zeng F., Tang B., Ding M. (2021) Remote Sensing, Heat Island Effect and Housing Price Prediction via AutoML. In: Ahram T. (eds) Advances in Artificial Intelligence, Software and Systems Engineering. AHFE 2020. Advances in Intelligent Systems and Computing, vol 1213. Springer, Cham. https://doi.org/10.1007/978-3-030-51328-3_17 (англ.)
↑ auto-sklearn на GitHub
↑ AutoGluon: AutoML for Text, Image, and Tabular Data. AutoGluon. Архів оригіналу за 11 листопада 2020. Процитовано 3 квітня 2021. (англ.)
↑ TransmogrifAI: Automated machine learning for structured data. TransmogrifAI. Архів оригіналу за 1 листопада 2020. Процитовано 3 квітня 2021. (англ.)
↑ Neural Network Intelligence на GitHub
↑ Azure ML documentation – What is AutoML?. Microsoft. Процитовано 3 квітня 2021. (англ.)
↑ Google Cloud AutoML. Google Cloud. Архів оригіналу за 13 листопада 2020. Процитовано 3 квітня 2021. (англ.)
↑ AutoAI with IBM Watson Studio. IBM. Архів оригіналу за 17 листопада 2020. Процитовано 3 квітня 2021. (англ.)
↑ The Oracle AutoML Pipeline. Oracle. Архів оригіналу за 17 листопада 2020. Процитовано 3 квітня 2021. (англ.)
↑ Data science platform. Oracle. Архів оригіналу за 16 листопада 2020. Процитовано 3 квітня 2021. (англ.)

Література

Open Source AutoML Tools: AutoGluon, TransmogrifAI, Auto-sklearn, and NNI. Bizety. 16 червня 2020. Архів оригіналу за 2 грудня 2020. Процитовано 15 листопада 2020. (англ.)

[autoweka1-1] Thornton C, Hutter F, Hoos HH, Leyton-Brown K (2013). Auto-WEKA: Combined Selection and Hyperparameter Optimization of Classification Algorithms. KDD '13 Proceedings of the 19th ACM SIGKDD international conference on Knowledge discovery and data mining. с. 847—855. Архів оригіналу за 28 липня 2020. Процитовано 15 листопада 2020. (англ.)

[AutoML2014ICML-2] а ^б Hutter F, Caruana R, Bardenet R, Bilenko M, Guyon I, Kegl B, and Larochelle H. AutoML 2014 @ ICML. AutoML 2014 Workshop @ ICML. Процитовано 28 березня 2018.{{cite web}}: Обслуговування CS1: Сторінки з параметром url-status, але без параметра archive-url (посилання) (англ.)

[3] Li R.Y.M., Chau K.W., Li H.C.Y., Zeng F., Tang B., Ding M. (2021) Remote Sensing, Heat Island Effect and Housing Price Prediction via AutoML. In: Ahram T. (eds) Advances in Artificial Intelligence, Software and Systems Engineering. AHFE 2020. Advances in Intelligent Systems and Computing, vol 1213. Springer, Cham. https://doi.org/10.1007/978-3-030-51328-3_17 (англ.)

[4] uto-sklearn на GitHub

[5] AutoGluon: AutoML for Text, Image, and Tabular Data. AutoGluon. Архів оригіналу за 11 листопада 2020. Процитовано 3 квітня 2021. (англ.)

[6] TransmogrifAI: Automated machine learning for structured data. TransmogrifAI. Архів оригіналу за 1 листопада 2020. Процитовано 3 квітня 2021. (англ.)

[7] Neural Network Intelligence на GitHub

[8] Azure ML documentation – What is AutoML?. Microsoft. Процитовано 3 квітня 2021. (англ.)

[9] Google Cloud AutoML. Google Cloud. Архів оригіналу за 13 листопада 2020. Процитовано 3 квітня 2021. (англ.)

[10] AutoAI with IBM Watson Studio. IBM. Архів оригіналу за 17 листопада 2020. Процитовано 3 квітня 2021. (англ.)

[11] The Oracle AutoML Pipeline. Oracle. Архів оригіналу за 17 листопада 2020. Процитовано 3 квітня 2021. (англ.)

[12] Data science platform. Oracle. Архів оригіналу за 16 листопада 2020. Процитовано 3 квітня 2021. (англ.)

[1]

[2]

[3]

[4]

[5]

[6]

[7]

[8]

[9]

[10]

[11]

[12]

Автоматизоване машинне навчання

Зміст

Порівняння зі стандартним підходом

Цілі автоматизації

Втілення

Відкриті

Комерційні

Див. також

Примітки

Література

Навігаційне меню

Автоматизоване машинне навчання

Порівняння зі стандартним підходом

Цілі автоматизації

Втілення

Відкриті

Комерційні

Див. також

Примітки

Література

Навігаційне меню

Пошук