Цитаты из книги автора Григорьев А. Машинное обучение. Портфолио реальных проектов

Читать отрывокОтрывок

В приложении удобнее QR для скачивания приложения

Huawei AppGallery RuStore Samsung Galaxy Store Xiaomi GetApps

Цитаты из книги автора Григорьев А. Машинное обучение. Портфолио реальных проектов

Читать отрывокОтрывок

О книге Цитаты60 Читают673 На полках

Влада Т.цитирует1 год назад

Сообщество энтузиастов обработки данных: https://datatalks.club

1 Нравится

Комментировать

Русланцитирует3 недели назад

Вместо того чтобы оценивать модель по одному конкретному порогу, мы можем сделать это для целого ряда — точно так же, как мы делали это для достоверности ранее в текущей главе.

Для этого мы сначала перебираем различные пороговые значения и вычисляем значения матрицы ошибок для каждого из них

Комментировать

Русланцитирует3 недели назад

Подсчитав, сколько раз наши прогнозы совпадали с фактическим значением, мы сможем использовать этот показатель для измерения качества нашей модели.

Такой показатель качества называется достоверностью. Очень легко рассчитать достоверность с помощью Numpy:

(y_val == churn).mean()

Комментировать

Русланцитирует3 недели назад

Мы используем оценку (score) для обозначения промежуточного результата перед применением сигмоидальной функции. Оценка может принимать любое реальное значение. Вероятность представляет собой результат применения сигмоидальной функции к оценке; это конечный результат, и он может принимать только значения от нуля до единицы.

Комментировать

Русланцитирует3 недели назад

Иногда, когда добавление нового признака приводит к снижению производительности, для решения проблемы бывает достаточно просто удалить этот признак. Наличие проверочного набора данных важно для принятия решения о том, следует ли добавить регуляризацию, удалить признак или сделать и то и другое: мы используем оценку на основе проверочных данных, чтобы выбрать наилучший вариант. В нашем конкретном случае мы видим, что добавление регуляризации нам помогает: этот шаг улучшает оценку, которую мы получали ранее.

Комментировать

Виталий Грушевичцитирует3 недели назад

В нашем случае прогноз становится равным 603 000 долларов:

Комментировать

Бехруз Исабаевцитирует1 год назад

orn — как раз одна из них.

Наконец %matplotlib inline в строке ❹ сообщает Jupyter‚ что в блокноте ожидаются графики и необходимо отображать их, как только они нам понадобятся.

Комментировать

Бехруз Исабаевцитирует1 год назад

Глубокому обучению и нейронным сетям в последнее время уделяется особое внимание, в основном благодаря прорыву в методах компьютерного зрения. Эти сети решают такие задачи, как классификация изображений, намного лучше, чем это делали более ранние методы. Глубокое обучение — подобласть машинного обучения, в которой функция g представляет собой нейронную сеть со многими слоями. Мы узнаем больше о нейронных сетях и глубоком обучении, начиная с главы 7, где обучаем модель глубокого обучения для классификации изображений.

Комментировать

Бехруз Исабаевцитирует1 год назад

• линейную регрессию для решения задачи регрессии (описывается в главе 2);

Комментировать

Александр Тузовцитирует1 год назад

Все древовидные модели могут решить проблему регрессии — спрогнозировать число. В Scikit-learn, DecisionTreeRegressor и RandomForestRegressor реализуют регрессионную вариацию моделей. В XGBoost нам потребуется изменить цель на reg:squarederror

Комментировать