Машинне навчання: базові поняття

1. Що таке машинне навчання

Машинне навчання (Machine Learning, ML) — це напрям штучного інтелекту, який вивчає методи, що дозволяють комп’ютерам навчатися на даних і робити прогнози або приймати рішення без явного програмування кожного кроку.

Простими словами: замість того, щоб писати правила вручну, ми даємо комп’ютеру приклади — і він сам знаходить закономірності.

Машинне навчання (Machine Learning, ML) — це клас методів штучного інтелекту (ШІ), що поєднує підходи та технології для створення алгоритмів, здатних самостійно навчатися на основі даних. На відміну від традиційних методів, при яких обчислювальні системи запрограмовані на виконання певних завдань, ML-моделі здатні покращувати свою роботу з часом, аналізуючи дані та виявляючи в них закономірності. Це дозволяє ML-системам вирішувати завдання, які складно чи неможливо запрограмувати вручну.

Приклади застосування:

рекомендації фільмів і музики (Netflix, Spotify);
розпізнавання облич і голосу;
фільтрація спаму в електронній пошті;
прогнозування погоди, цін, попиту;
медична діагностика.

2. Дані — основа машинного навчання

Машинне навчання працює з даними.

Основні поняття:

Об’єкт (запис, приклад) — один рядок даних (наприклад, один користувач).
Ознака (feature) — характеристика об’єкта (вік, вага, температура).
Набір даних (dataset) — сукупність об’єктів та їх ознак.

3. Основні типи машинного навчання

3.1. Навчання з учителем (Supervised Learning)

Алгоритм навчається на розмічених даних, де відома правильна відповідь.

Використовується для:

Класифікації — передбачення категорії
(спам / не спам, хворий / здоровий)
Регресії — передбачення числового значення
(ціна, температура, прибуток)

📌 Приклад: прогноз ціни квартири на основі її характеристик.

3.2. Навчання без учителя (Unsupervised Learning)

Алгоритм працює з нерозміченими даними та сам шукає структуру.

🔹 Основні задачі:

Кластеризація — групування схожих об’єктів
Зменшення розмірності — спрощення даних

📌 Приклад: сегментація клієнтів за поведінкою.

3.3. Навчання з підкріпленням (Reinforcement Learning)

Модель навчається через взаємодію з середовищем, отримуючи нагороду або штраф.

🔹 Характерно для:

ігор (шахи, Go);
робототехніки;
автономних систем.

📌 Приклад: агент навчається грати в гру, максимізуючи кількість очок.

4. Модель машинного навчання

Модель — це математична функція, яка:

отримує вхідні дані;
робить прогноз або рішення.

Процес навчання:

Збір даних
Підготовка даних
Навчання моделі
Оцінка якості
Використання (прогнозування)

5. Навчальна, тестова та валідаційна вибірки

Щоб оцінити модель коректно, дані ділять на частини:

Навчальна вибірка — для навчання моделі
Валідаційна вибірка — для налаштування параметрів
Тестова вибірка — для фінальної оцінки якості

6. Переобучення та недообучення

Важливі проблеми машинного навчання:

Недообучення (Underfitting)
Модель занадто проста і не вловлює закономірності.
Переобучення (Overfitting)
Модель занадто добре запам’ятала навчальні дані, але погано працює на нових.

📌 Мета — знайти баланс між складністю моделі та її узагальнюючою здатністю.

7. Метрики якості

Для оцінки роботи моделей використовують метрики.

Для класифікації:

точність (accuracy);
повнота (recall);
точність позитивних відповідей (precision).

🔹 Для регресії:

середня абсолютна помилка (MAE);
середньоквадратична помилка (MSE).

8. Підсумок

Машинне навчання:

дозволяє комп’ютерам навчатися на даних;
має різні типи навчання;
широко застосовується в реальному житті;
вимагає якісних даних і правильної оцінки результатів.