Последнее время про искусственный интеллект говорят буквально из каждого утюга. По телеку рассказывают про умные бритвы с ИИ, кто-то уже уверяет, что нейросети засунули даже в холодильники, другие спорят, что настоящий ИИ — это что-то вроде ChatGPT, а некоторые и вовсе боятся, что ИИ скоро захватит мир.
Но давайте спокойно разберемся: что такое этот ваш искусственный интеллект и такой ли он “искусственный”, как многие привыкли думать?
Если говорить по-простому, то область знаний, которая за это отвечает, называется машинное обучение (machine learning). То есть буквально: как научить машину (компьютер), чему-то полезному?
И вот тут важный момент: задач у машинного обучения огромное количество. И далеко не все из них — это какие-то нейросети, роботы из будущего и “разумные машины”.
Простой пример
Например, вы продаете автомобиль на известном бело-синем сайте. Публикуете объявление, а сайт вам пишет: “Ваша цена выше рынка” или “Ваша цена ниже рынка”.
Откуда он это знает? Что за магия?
Нет никакой магии. На самом деле за этим стоит математический алгоритм. Очень часто такие задачи решаются с помощью моделей машинного обучения, например линейной регрессии.
Грубо говоря, модель пытается предсказать, сколько на самом деле должна стоить ваша машина, если смотреть на похожие автомобили.
То есть сайт как бы говорит:
“Мы уже видели тысячи похожих машин. И, судя по ним, твоя цена выглядит завышенной”
или наоборот
“Ты продаешь слишком дешево”
Еще один пример
Другой пример из жизни — кредиты, кредитные карты или ипотека.
Наверняка многие хотя бы раз задавались вопросом: а как банк вообще решает, одобрять мне кредит или нет?
И тут тоже очень часто используется машинное обучение. В банках обычно применяют более сложные модели, например градиентный бустинг.
Но сама идея примерно та же: взять данные из прошлого и попытаться по ним предсказать результат по конкретному клиенту.
Как это работает
И вот здесь возникает вполне логичный вопрос:
Почему банк решил, что мне можно или нельзя дать кредит?
Почему сайт решил, что моя машина стоит именно столько?
На самом деле общий принцип довольно простой.
Представьте, что у нас есть данные о множестве объектов. Объектом может быть человек, автомобиль, квартира — что угодно.
У каждого такого объекта есть характеристики. В машинном обучении их обычно называют признаками.
Например:
Для клиента банка признаки могут быть:
- возраст
- доход
- семейное положение
- наличие детей
- кредитная история
Для автомобиля:
- год выпуска
- пробег
- цвет
- количество владельцев
- марка/модель
Но кроме признаков есть еще и то, что мы хотим научиться предсказывать. Это называется таргет.
Например:
для клиента банка таргет — вернул он кредит или не вернул
для машины таргет — ее цена
Что делает модель
Она берет огромное количество таких примеров из прошлого и пытается найти закономерности.
На пальцах это выглядит так:
модель как будто замечает, что среди людей, которые не возвращали кредит, часто встречались определенные сочетания характеристик.
Или замечает, что машины с определенными параметрами обычно продавались примерно за такую-то цену.
А когда приходите вы со своей анкетой в банк или со своей машиной — модель сравнивает ваши данные с тем, что уже видела раньше, и делает вывод.
“Ага, похожие клиенты у нас уже были. Есть высокий риск, что кредит не вернут.”
или
“Ага, машины с такими характеристиками обычно продавались за N тысяч рублей.”
Главная мысль
Алгоритм ничего не “берет из воздуха”. Он работает на основе реальных данных из прошлого.
И уже на основе этих данных пытается найти зависимости.
Данных обычно нужно очень много — сотни тысяч или даже миллионы примеров.
Потому что чем больше данных, тем выше шанс, что модель найдет реальные закономерности, а не случайные совпадения.
Итог
Конечно, я сейчас все очень сильно упростил. Но на базовом уровне смысл машинного обучения примерно такой.
В следующих постах будем дальше разбираться, как работают нейросети.
Теперь вы немножко в курсе, что новомодный искусственный интеллект не такой уж и искусственный 😉