Как обучить нейронную сеть?

Аватар автора
Отомсти монотонности
Как обучить нейронную сеть? Что такое Loss, Градиентный Спуск и Backpropagation? Узнайте в этом видео! Нейронные сети обучаются с помощью метода обучения с учителем (обучение на прецедентах, Supervised Learning). Для обучения нейросети нам понадобится обучающая выборка (набор данных, датасет), состоящая из пар [входной объект, известный правильный ответ]. Неявная задача нейронной сети – научиться обобщать, искать закономерности в данных. В противном случае будет переобучение (overfitting). У сети есть обучаемые параметры (веса) и гиперпараметры, которые не обучаются (например, количество слоёв, количество нейронов и т. д.). Введём понятие функция потерь (функция ошибок, Loss функция), которая характеризует то, как сильно нейронная сеть ошибается. Задача обучения – найти такие параметры (веса) нейронной сети, при которых функция ошибок минимальна. Другими словами, необходимо решить задачу оптимизации (минимизации ошибки относительно весов). Для регрессии можно использовать Mean Squared Error (MSE), а для классификации (где используются распределения вероятностей) – кросс-энтропию (Cross Entropy). Для поиска минимума функции можно использовать градиентный спуск. В этом методе итерационно вычисляется вектор градиента ошибки (частные производные ошибки по всем параметрам) и корректируются параметры по направлению антиградиента. Коэффициент при антиградиенте называется скорость обучения (Learning Rate). Для обучения нейронных сетей используется стохастический градиентный...

0/0


0/0

0/0

0/0