Мюллер А., Гидо С. Введение в машинное обучение с помощью Python

Файл формата pdf
размером 13,28 МБ

Добавлен пользователем kav2006 20.02.2017 01:10
Описание отредактировано 14.07.2024 20:39

Мюллер А., Гидо С. Введение в машинное обучение с помощью Python

М.: O’Reilly Media, 2017. — 392 с.

Машинное обучение стало неотъемлемой частью различных коммерческих и исследовательских проектов, однако эта область не является прерогативой больших компаний с мощными аналитическими командами. Даже если вы еще новичок в использовании Python, эта книга познакомит вас с практическими способами построения систем машинного обучения. При всем многообразии данных, доступных на сегодняшний день, применение машинного обучения ограничивается лишь вашим воображением. Вы изучите этапы, необходимые для создания успешного приложения на базе машинного обучения, используя Python и библиотеку scikit-learn. Авторы Андреас Мюллер и Сара Гидо сосредоточили свое внимание на практических аспектах применения алгоритмов машинного обучения. Знание библиотек NumPy и matplotlib позволит вам извлечь из этой книги еще больше полезной информации.

Предисловие
Кому стоит прочитать эту книгу
Почему мы написали эту книгу
Структура книги
Онлайн-ресурсы
Типографские соглашения
Использование примеров программного кода
Благодарности
Введение
Зачем нужно использовать машинное обучение?
Задачи, которые можно решить с помощью машинного обучения
Постановка задач и знакомство с данными
Почему нужно использовать Python?
scikit-learn
Установка scikit-learn
Основные библиотеки и инструменты
Jupyter Notebook
NumPy
SciPy
matplotlib
pandas
mglearn
Сравнение Python 2 и Python 3
Версии библиотек, используемые в этой книге
Первый пример: классификация сортов ириса
Загружаем данные
Метрики эффективности: обучающий и тестовый наборы
Сперва посмотрите на Ваши данные
Построение вашей первой модели: метод k ближайших соседей
Получение прогнозов
Оценка качества модели
Выводы и перспективы
Методы машинного обучения с учителем
Классификация и регрессия
Обобщающая способность, переобучение и недообучение
Взаимосвязь между сложностью модели и размером набора данных
Алгоритмы машинного обучения с учителем
Некоторые наборы данных
Метод k ближайших соседей
Линейные модели
Наивные байесовские классификаторы
Деревья решений
Ансамбли деревьев решений
Ядерный метод опорных векторов
Нейронные сети (глубокое обучение)
Оценки неопределенности для классификаторов
Решающая функция
Прогнозирование вероятностей
Неопределенность в мультиклассовой классификации
Выводы и перспективы
Методы машинного обучения без учителя и предварительная обработка данных
Типы машинного обучения без учителя
Проблемы машинного обучения без учителя
Предварительная обработка и масштабирование
Различные виды предварительной обработки
Применение преобразований данных
Масштабирование обучающего и тестового наборов одинаковым образом
Влияние предварительной обработки на машинное обучение с учителем
Снижение размерности, выделение признаков и множественное обучение
Анализ главных компонент (PCA)
Факторизация неотрицательных матриц (NMF)
Множественное обучение с помощью алгоритма t-SNE
Кластеризация
Кластеризация k-средних
Агломеративная кластеризация
DBSCAN
Сравнение и оценка качества алгоритмов кластеризации
Выводы по методам кластеризации
Выводы и перспективы
Типы данных и конструирование признаков
Категориальные переменные
Прямое кодирование (дамми-переменные)
Числа можно закодировать в виде категорий
Биннинг, дискретизация, линейные модели и деревья
Взаимодействия и полиномы
Одномерные нелинейные преобразования
Автоматический отбор признаков
Одномерные статистики
Отбор признаков на основе модели
Итеративный отбор признаков
Применение экспертных знаний
Выводы и перспективы
Оценка и улучшение качества модели
Перекрестная проверка
Перекрестная проверка в scikit-learn
Преимущества перекрестной проверки
Стратифицированная k-блочная перекрестная проверка и другие стратегии
Решетчатый поиск
Простой решетчатый поиск
Опасность переобучения параметров и проверочный набор данных
Решетчатный поиск с перекрестной проверкой
Метрики качества модели и их вычисление
Помните о конечной цели
Метрики для бинарной классификации
Метрики для мультиклассовой классификации
Метрики регрессии
Использование метрик оценки для отбора модели
Выводы и перспективы
Объединение алгоритмов в цепочки и конвейеры
Отбор параметров с использованием предварительной обработки
Построение конвейеров
Использование конвейера, помещенного в объект GridSearchCV
Общий интерфейс конвейера
Удобный способ построения конвейеров с помощью функции make_pipeline
Работа с атрибутами этапов
Работа с атрибутами конвейера, помещенного в объект GridSearchCV
Находим оптимальные параметры этапов конвейера с помощью решетчатого поиска
Выбор оптимальной модели с помощью решетчатого поиска
Выводы и перспективы
Работа с текстовыми данными
Строковые типы данных
Пример применения: анализ тональности киноотзывов
Представление текстовых данных в виде «мешка слов»
Применение модели «мешка слов» к синтетическому набору данных
Модель «мешка слов» для киноотзывов
Стоп-слова
Масштабирование данных с помощью tf-idf
Исследование коэффициентов модели
Модель «мешка слов» для последовательностей из нескольких слов (n-грамм)
Продвинутая токенизация, стемминг и лемматизация
Моделирование тем и кластеризация документов
Латентное размещение Дирихле
Выводы и перспективы
Подведение итогов
Общий подход к решению задач машинного обучения
Вмешательство человека в работу модели
От прототипа к производству
Тестирование производственных систем
Создание своего собственного класса Estimator
Куда двигаться дальше
Теория
Другие фреймворки и пакеты машинного обучения
Ранжирование, рекомендательные системы и другие виды обучения
Вероятностное моделирование, теория статистического вывода и вероятностное программирование
Нейронные сети
Масштабирование на больших наборах данных
Оттачивание навыков
Заключение

Чтобы скачать этот файл зарегистрируйтесь и/или войдите на сайт используя форму сверху.
Регистрация

Узнайте сколько стоит уникальная работа конкретно по Вашей теме:
Сколько стоит заказать работу?

Смотри также

Подробнее

Вьюгин В.В. Математические основы теории машинного обучения и прогнозирования

Раздел: Искусственный интеллект → Машинное обучение (Machine Learning)

М.: МЦНМО, 2013. — 390 с. Книга предназначена для первоначального знакомства с математическими основами современной теории машинного обучения (Machine Learning) и теории игр с предсказаниями. В первой части излагаются основы статистической теории машинного обучения, рассматриваются задачи классификации и регрессии с опорными векторами, теория обобщения и алгоритмы построения...

1,78 МБ
добавлен 02.07.2014 14:57
описание отредактировано 22.06.2018 02:16

Подробнее

Грас Джоэл. Data Science. Наука о данных с нуля

Раздел: Компьютерная литература → Наука о данных

Перевод с английского. — СПб: БХВ-Петербург, 2017. — 336 с. — ISBN 978-5-9775-3758-2. Книга позволяет изучить науку о данных (Data Science) и применить полученные знания на практике. Она написана так, что способствует погружению в Data Science аналитика, фактически не обладающего глубокими знаниями в этой прикладной дисциплине. В объёмах, достаточных для начала работы в области...

9,72 МБ
добавлен 26.04.2018 17:28
описание отредактировано 04.08.2023 02:59

Подробнее

Доусон М. Программируем на Python

Раздел: Компьютерная литература → Python

3-е изд. — СПб.: Питер, 2014. — 416 с.: ил. — ISBN 9785459003147, 9781435455009. Эта книга - идеальное пособие для начинающих изучать Python. Руководство, написанное опытным разработчиком и преподавателем, научит фундаментальным принципам программирования на примере создания простых игр. Вы приобретете необходимые навыки для разработки приложений на Python и узнаете, как их...

52,76 МБ
добавлен 12.08.2014 01:18
описание отредактировано 22.09.2024 04:08

Подробнее

Рашид Т. Создаем нейронную сеть

Раздел: Искусственный интеллект → Нейронные сети

СПб.: Альфа-книга, 2017. — 274 с. — ISBN: 9785990944572. Эта книга представляет собой введение в теорию и практику создания нейронных сетей. Она предназначена для тех, кто хочет узнать, что такое нейронные сети, где они применяются и как самому создать такую сеть, не имея опыта работы в данной области. Автор простым и понятным языком объясняет теоретические аспекты, знание...

43,46 МБ
добавлен 27.11.2017 21:31
описание отредактировано 15.03.2024 20:11

Подробнее

Силен Д., Мейсман А., Али М. Основы Data Science и Big Data. Python и наука о данных

Раздел: Искусственный интеллект → Интеллектуальный анализ данных

СПб.: Питер, 2017. — 336 с. — (Библиотека программиста). — ISBN: 9785496025171. Data Science - это совокупность понятий и методов, позволяющих придать смысл и понятный вид огромным объемам данных. Каждая из глав этой книги посвящена одному из самых интересных аспектов анализа и обработки данных. Вы начнете с теоретических основ, затем перейдете к алгоритмам машинного обучения,...

108,32 МБ
добавлен 21.02.2017 01:30
описание отредактировано 09.10.2023 20:23

Подробнее

Хайкин С. Нейронные сети. Полный курс

Раздел: Искусственный интеллект → Нейронные сети

2-e изд. — Пер. с англ. — М.: Вильямс, 2006. — 1104 с.: ил. В книге рассматриваются основные парадигмы искусственных нейронных сетей. Представленный материал содержит строгое математическое обоснование всех нейросетевых парадигм, иллюстрируется примерами, описанием компьютерных экспериментов, содержит множество практических задач, а также обширную библиографию. В книге также...

18,63 МБ
дата добавления неизвестна
описание отредактировано 21.11.2020 03:52

Главная

Наверх