Что такое ансамблевое обучение? Понимание методов машинного обучения
Если вы новичок и хотите подробно понять, что такое ансамбль, или хотите освежить свои знания о дисперсии и смещении, приведенная ниже подробная статья даст вам глубокое представление об ансамблевом обучении, ансамблевых методах в машинном обучении, алгоритм ансамбля, а также критические методы ансамбля, такие как повышение и объединение. Но прежде чем углубляться в то, что, почему и как происходит в ансамбле, давайте сначала рассмотрим несколько примеров из реальной жизни, которые упростят концепции, лежащие в основе ансамблевого обучения.
Пример 1: Если вы планируете купить кондиционер, зайдете ли вы в выставочный зал и купите кондиционер, который вам покажет продавец? Ответ, вероятно, нет. В наши дни вы, вероятно, спросите мнение своих друзей, семьи и коллег, изучите различные порталы о различных моделях и посетите несколько обзорных сайтов, прежде чем принять решение о покупке. Короче говоря, вы не придете к такому выводу напрямую. Вместо этого вам следует попытаться принять более обоснованное решение после рассмотрения различных мнений и обзоров. В случае ансамблевого обучения применяется тот же принцип. Теперь давайте разберемся, что означает ансамбль.
Что такое ансамбль?
Ансамблевые методы в машинном обучении объединяют информацию, полученную из нескольких моделей обучения, для принятия точных и улучшенных решений. Эти методы основаны на том же принципе, что и приведенный выше пример покупки кондиционера.
В моделях обучения шум, дисперсия и предвзятость являются основными источниками ошибок. Ансамблевые методы в машинном обучении помогают минимизировать эти факторы, вызывающие ошибки, тем самым обеспечивая точность и стабильность алгоритмов машинного обучения (ML).
Программы для Windows, мобильные приложения, игры - ВСЁ БЕСПЛАТНО, в нашем закрытом телеграмм канале - Подписывайтесь:)
Пример 2. Предположим, вы разрабатываете приложение для туристической индустрии. Очевидно, что прежде чем опубликовать приложение, вы захотите получить важные отзывы об ошибках и потенциальных лазейках, которые влияют на взаимодействие с пользователем. Какие у вас есть варианты получения критической обратной связи? 1) Узнать мнение своих родителей, супруга или близких друзей. 2) Опросить своих коллег, которые регулярно путешествуют, а затем оценить их ответ. 3) Запуск бета-версии приложения для путешествий и туризма для сбора отзывов от непредвзятой аудитории и туристического сообщества.
Задумайтесь на мгновение о том, что вы делаете. Вы принимаете во внимание различные мнения и идеи широкого круга людей, чтобы исправить проблемы, ограничивающие взаимодействие с пользователем. Ансамблевая нейронная сеть и ансамблевый алгоритм делают одно и то же.
Пример 3. Представьте себе группу людей с завязанными глазами, играющих в игру «Потрогай и скажи», где их просят потрогать и исследовать мини-фабрику по производству пончиков, которую никто из них никогда раньше не видел. Поскольку у них завязаны глаза, их версия того, как выглядит мини-фабрика по производству пончиков, будет варьироваться в зависимости от частей прибора, к которым они прикасаются. Теперь предположим, что их лично попросили описать, к чему они прикасались. В этом случае их индивидуальный опыт даст точное описание конкретных частей мини-фабрики по производству пончиков. Тем не менее, в совокупности их совокупный опыт позволит получить очень подробное описание всего оборудования.
Аналогично, ансамблевые методы в машинном обучении используют набор моделей и преимущества смешанного результата, который по сравнению с одиночной моделью наверняка будет лучшим вариантом, когда дело касается точности прогнозирования.
Технический пакет
Вот список методов ансамблевого обучения, начиная с базовых ансамблевых методов и заканчивая более продвинутыми подходами.
Простые ансамблевые методы
Режим: В статистической терминологии «режим» — это число или значение, которое чаще всего появляется в наборе данных чисел или значений. В этом ансамблевом методе специалисты по машинному обучению используют ряд моделей для прогнозирования каждой точки данных. Прогнозы, сделанные с помощью разных моделей, рассматриваются как отдельные голоса. Впоследствии прогноз, сделанный большинством моделей, рассматривается как окончательный прогноз.
Среднее/среднее: В методе ансамбля среднего/среднего аналитики данных принимают во внимание средние прогнозы, сделанные всеми моделями, при составлении окончательного прогноза.
Давайте, например, сто человек оценили бета-версию вашего приложения для путешествий и туризма по шкале от 1 до 5, где 15 человек дали оценку 1, 28 человек дали оценку 2, 37 человек дали оценку 2. 3, 12 человек поставили оценку 4, а 8 человек поставили оценку 5.
Среднее значение в данном случае составляет – (1*15) + (2 * 28) + (3 * 37) + (4 * 12) + (5 * 8)/100 = 2,7.
Средневзвешенное значение. В ансамблевом методе средневзвешенного значения ученые, работающие с данными, присваивают разные веса всем моделям, чтобы сделать прогноз, где присвоенный вес определяет релевантность каждой модели. В качестве примера предположим, что из 100 человек, оставивших отзыв о вашем приложении для путешествий, 70 являются профессиональными разработчиками приложений, а остальные 30 не имеют опыта разработки приложений. В этом сценарии метод средневзвешенного ансамбля придаст больший вес отзывам разработчиков приложений по сравнению с другими.
Расширенные ансамблевые методы
Пакетирование (бутстрап-агрегирование). Основная цель ансамблевого метода «пакетирования» или «бутстрап-агрегирования» — минимизировать ошибки дисперсии в деревьях решений. Целью здесь является случайное создание выборок наборов обучающих данных с заменой (подмножествами обучающих данных). Подмножества затем используются для обучения деревьев или моделей решений. Следовательно, существует комбинация нескольких моделей, что уменьшает дисперсию, поскольку средний прогноз, полученный на основе разных моделей, гораздо более надежен и устойчив, чем одна модель или дерево решений.
Повышение: метод итеративного ансамбля, «повышение», корректирует вес наблюдения на основе его последней классификации. В случае, если наблюдение неправильно классифицировано, «повышение» увеличивает вес наблюдения, и наоборот. Алгоритмы повышения уменьшают ошибки систематической ошибки и создают превосходные модели прогнозирования.
В методе ансамбля повышения исследователи данных обучают первый алгоритм повышения на всем наборе данных, а затем строят последующие алгоритмы, подбирая остатки из первого алгоритма повышения, тем самым придавая больший вес наблюдениям, которые предыдущая модель предсказала неточно.
Выберите правильную программу
Освойте будущее технологий с помощью курсов Simplilearn по искусственному интеллекту и машинному обучению. Откройте для себя возможности искусственного интеллекта и машинного обучения и приобретите навыки, необходимые для достижения успеха в отрасли. Выберите подходящую программу и раскройте свой потенциал уже сегодня. Зарегистрируйтесь сейчас и проложите свой путь к успеху!
Название программы | Инженер по искусственному интеллекту | Последипломная программа в области искусственного интеллекта | Последипломная программа в области искусственного интеллекта |
Гео | Все регионы | Все регионы | В/СТРОКА |
Университет | Простое обучение | Пердью | Калифорнийский технологический институт |
Длительность курса | 11 месяцев | 11 месяцев | 11 месяцев |
Требуется опыт кодирования | Базовый | Базовый | Нет |
Навыки, которые вы изучите | Более 10 навыков, включая структуру данных, манипулирование данными, NumPy, Scikit-Learn, Tableau и многое другое. | 16+ навыков, включая чат-боты, НЛП, Python, Keras и многое другое. | 8+ навыков, включая Контролируемое и неконтролируемое обучение Глубокое обучение Визуализация данных и многое другое. |
Дополнительные преимущества | Получите доступ к эксклюзивным хакатонам, мастер-классам и сеансам «Спроси меня о чем-нибудь» от IBM Прикладное обучение посредством 3 основных и 12 отраслевых проектов. | Членство в Ассоциации выпускников Purdue Бесплатное членство в IIMJobs на 6 месяцев Помощь в составлении резюме | До 14 кредитов CEU Членство в кружке Caltech CTME |
Расходы | $$ | $$$$ | $$$$ |
Изучите программу | Изучите программу | Изучите программу |
Хотите освоить ансамблевые алгоритмы для успешной карьеры в области машинного обучения?
Самый простой способ получить высокооплачиваемую работу в сфере машинного обучения — пройти сертификацию в всемирно известном образовательном учреждении, таком как Simplilearn. Программа последипломного образования в области искусственного интеллекта и машинного обучения, представленная ведущим в мире онлайн-учебным курсом и сертификационным курсом Simplilearn в сотрудничестве с Калифорнийским технологическим институтом, предоставит вам глубокое понимание основных концепций ансамблевых методов в машинном обучении.
Пытаясь укрепить ваши знания по этому обширному предмету, Simplilearn предлагает программу последипломного образования в области искусственного интеллекта и машинного обучения, проводимую преподавателями Калифорнийского технологического института, более 25 проектов с наборами отраслевых данных, эксклюзивные хакатоны IBM и завершающий этап из 3 доменов. Признанный в отрасли сертификационный курс также предлагает уникальную программу JobAssist — нажмите здесь, чтобы получить дополнительную информацию.
Программы для Windows, мобильные приложения, игры - ВСЁ БЕСПЛАТНО, в нашем закрытом телеграмм канале - Подписывайтесь:)