Что такое нейронные сети с радиальными базисными функциями? Все, что Вам нужно знать
Сети радиальной базовой функции (RBF) — это особый тип искусственных нейронных сетей, используемых для задач аппроксимации функций. Сети RBF отличаются от других нейронных сетей трехуровневой архитектурой, универсальной аппроксимацией и более высокой скоростью обучения. В этой статье мы опишем нейронную сеть радиальных базисных функций, ее работу, архитектуру и использование в качестве нелинейного классификатора.
Ваша карьера в области искусственного интеллекта и машинного обучения уже не за горами! Магистерская программа AI EngineerИзучите программу
Что такое радиальные базисные функции?
Радиальные базисные функции — это особый класс нейронных сетей прямого распространения, состоящий из трех слоев: входного слоя, скрытого слоя и выходного слоя. Это фундаментально отличается от большинства архитектур нейронных сетей, которые состоят из множества слоев и обеспечивают нелинейность за счет периодического применения нелинейных функций активации. Входной уровень получает входные данные и передает их в скрытый уровень, где происходят вычисления. Скрытый уровень нейронной сети радиальных базисных функций является самым мощным и сильно отличается от большинства нейронных сетей. Выходной слой предназначен для задач прогнозирования, таких как классификация или регрессия.
Ваша карьера в области искусственного интеллекта и машинного обучения уже не за горами! Магистерская программа AI EngineerИзучите программу
Программы для Windows, мобильные приложения, игры - ВСЁ БЕСПЛАТНО, в нашем закрытом телеграмм канале - Подписывайтесь:)
Как работают сети RBF?
Нейронные сети RBF концептуально похожи на модели K-Nearest Neighbor (k-NN), хотя реализация обеих моделей резко отличается. Фундаментальная идея радиальных базисных функций заключается в том, что прогнозируемое целевое значение элемента, скорее всего, будет таким же, как и у других элементов с близкими значениями переменных-предикторов. Сеть RBF размещает один или несколько нейронов RBF в пространстве, описываемом переменными-предикторами. Пространство имеет несколько измерений, соответствующих количеству присутствующих переменных-предсказателей. Мы вычисляем евклидово расстояние от оцениваемой точки до центра каждого нейрона. Радиальная базисная функция (RBF), также известная как функция ядра, применяется к расстоянию для расчета веса (влияния) каждого нейрона. Название радиальной базовой функции происходит от расстояния радиуса, которое является аргументом функции. Вес = RBF(расстояние) Чем больше расстояние нейрона от оцениваемой точки, тем меньшее влияние (вес) он имеет.
Радиальные базисные функции
Радиальная базисная функция — это вещественная функция, значение которой зависит только от расстояния от начала координат. Хотя мы используем различные типы радиальных базисных функций, наиболее распространенной является функция Гаусса.
В случае более чем одной переменной-предиктора нейронная сеть радиальных базисных функций имеет то же количество измерений, что и переменные. Если три нейрона находятся в пространстве с двумя переменными-предикторами, мы можем предсказать значение с помощью функций RBF. Мы можем вычислить наиболее предсказанное значение для новой точки, сложив выходные значения функций RBF, умноженные на веса, обработанные для каждого нейрона.
Радиальная базисная функция нейрона состоит из центра и радиуса (также называемого распространением). Радиус может различаться у разных нейронов. В сетях RBF, сгенерированных DTREG, радиус каждого измерения может отличаться.
По мере увеличения разброса большее влияние оказывают нейроны, находящиеся на расстоянии от точки.
Ваша карьера в области искусственного интеллекта и машинного обучения уже не за горами! Магистерская программа AI EngineerИзучите программу
Сетевая архитектура RBF
Типичная архитектура нейронной сети с радиальными базисными функциями состоит из входного слоя, скрытого слоя и слоя суммирования.
Входной слой
Входной слой состоит из одного нейрона для каждой переменной-предиктора. Входные нейроны передают значение каждому нейрону скрытого слоя. N-1 нейронов используются для категориальных значений, где N обозначает количество категорий. Диапазон значений стандартизируют путем вычитания медианы и деления на межквартильный размах.
Скрытый слой
Скрытый слой содержит переменное количество нейронов (идеальное количество, определяемое процессом обучения). Каждый нейрон содержит радиальную базисную функцию с центром в точке. Количество измерений совпадает с количеством переменных-предикторов. Радиус или разброс функции RBF могут различаться для каждого измерения.
Когда вектор x входных значений поступает из входного слоя, скрытый нейрон вычисляет евклидово расстояние между тестовым примером и центральной точкой нейрона. Затем он применяет функцию ядра, используя значения спреда. Результирующее значение поступает в слой суммирования.
Выходной слой или слой суммирования
Значение, полученное из скрытого слоя, умножается на вес, относящийся к нейрону, и передается на суммирование. Здесь взвешенные значения суммируются, и сумма представляется как выходные данные сети. Задачи классификации имеют один выход для каждой целевой категории, значение которого представляет собой вероятность того, что оцениваемый случай относится к этой категории.
Входной вектор
Это n-мерный вектор, который вы пытаетесь классифицировать. Весь входной вектор предоставляется каждому из RBF-нейронов.
RBF-нейроны
Каждый RBF-нейрон хранит вектор-прототип (также известный как центр нейрона) из векторов обучающего набора. Нейрон RBF сравнивает входной вектор с его прототипом и выводит значение от 0 до 1 в качестве меры сходства. Если входной сигнал такой же, как у прототипа, выходной сигнал нейрона будет равен 1. По мере роста разницы между входным сигналом и прототипом выходной сигнал экспоненциально падает к 0. Форма ответа RBF-нейрона представляет собой колоколообразную кривую. Значение ответа также называется значением активации.
Выходные узлы
Выходные данные сети включают набор узлов для каждой категории, которую вы пытаетесь классифицировать. Каждый выходной узел вычисляет оценку для соответствующей категории. Обычно мы принимаем решение о классификации, присваивая входные данные категории с наивысшим баллом.
Оценка рассчитывается на основе взвешенной суммы значений активации всех RBF-нейронов. Обычно он придает положительный вес RBF-нейрону, принадлежащему к его категории, и отрицательный вес другим. Каждый выходной узел имеет свой собственный набор весов.
Пример радиальной базисной функции
Давайте рассмотрим полностью обученный пример радиальной базисной функции.
Набор данных содержит двумерные точки данных, принадлежащие двум отдельным классам. Сеть RBF была обучена с использованием 20 нейронов RBF на указанном наборе данных. Мы можем отметить выбранные прототипы и просмотреть оценку первой категории в поле ввода. Для просмотра мы можем нарисовать трехмерную сетку или контурный график.
Районы с наивысшим и наименьшим баллом первой категории должны быть отмечены отдельно.
В случае выходного узла первой категории:
- Все веса для RBF-нейронов категории 2 будут отрицательными.
- Все веса для RBF-нейронов категории 1 будут положительными.
Наконец, аппроксимацию границы решения можно построить путем вычисления оценок по конечной сетке.
Ваша карьера в области искусственного интеллекта и машинного обучения уже не за горами! Магистерская программа AI EngineerИзучите программу
Обучение RBFN
Процесс обучения включает в себя выбор таких параметров:
- Прототип (мю)
- Бета-коэффициент для каждого RBF-нейрона и
- Матрица выходных весов между нейронами и выходными узлами.
Существует несколько подходов к выбору прототипов и их изменений, например создание RBF-нейрона для каждого обучающего примера или случайный выбор k прототипов из обучающих данных.
При указании бета-коэффициентов установите сигму, равную среднему расстоянию между точками в кластере и центром.
Выходные веса можно обучить с помощью градиентного спуска.
Преимущества РБФН
- Простой дизайн
- Хорошее обобщение
- Ускоренное обучение
- Только один скрытый слой
- Простая интерпретация значения или функции каждого узла скрытого слоя.
Выберите правильную программу
Улучшите свою карьеру в области искусственного интеллекта и машинного обучения с помощью комплексных курсов Simplilearn. Получите навыки и знания, которые помогут преобразовать отрасли и раскрыть свой истинный потенциал. Зарегистрируйтесь сейчас и откройте безграничные возможности!
Название программы | Инженер по искусственному интеллекту | Последипломная программа в области искусственного интеллекта | Последипломная программа в области искусственного интеллекта |
Гео | Все регионы | Все регионы | В/СТРОКА |
Университет | Простое обучение | Пердью | Калифорнийский технологический институт |
Длительность курса | 11 месяцев | 11 месяцев | 11 месяцев |
Требуется опыт кодирования | Базовый | Базовый | Нет |
Навыки, которые вы изучите | Более 10 навыков, включая структуру данных, манипулирование данными, NumPy, Scikit-Learn, Tableau и многое другое. | 16+ навыков, включая чат-боты, НЛП, Python, Keras и многое другое. | 8+ навыков, включая Контролируемое и неконтролируемое обучение Глубокое обучение Визуализация данных и многое другое. |
Дополнительные преимущества | Получите доступ к эксклюзивным хакатонам, мастер-классам и сеансам «Спроси меня о чем-нибудь» от IBM Прикладное обучение посредством 3 основных и 12 отраслевых проектов. | Членство в Ассоциации выпускников Purdue Бесплатное членство в IIMJobs на 6 месяцев Помощь в составлении резюме | До 14 кредитов CEU Членство в кружке Caltech CTME |
Расходы | $$ | $$$$ | $$$$ |
Изучите программу | Изучите программу | Изучите программу |
Заключение
Если вы заинтересованы в более глубоком понимании сети радиальных базисных функций или любой другой нейронной сети, присоединяйтесь к курсу машинного обучения Simplilearn прямо сейчас и станьте экспертом НЛП.
Наши ученики также задают вопросы
1. Для чего используется нейронная сеть с радиальной базисной функцией?
Нейронные сети с радиальной базисной функцией — это обычно используемые искусственные нейронные сети, используемые для задач аппроксимации функций и машинной классификации опорных векторов.
2. Какова роль радиального базиса?
Радиальные базисные функции предоставляют способы аппроксимации функций многих переменных с помощью линейных комбинаций терминов, основанных на одной одномерной функции.
3. Что такое радиальная базисная функция в ML?
Радиальные базисные функции (RBF) — это функции с действительным знаком, которые используют контролируемое машинное обучение (ML) для работы в качестве нелинейного классификатора. Его значение зависит от расстояния между входом и определенной фиксированной точкой.
4. В чем преимущество нейронной сети RBF?
Основными преимуществами нейронной сети RBF являются:
- Простой дизайн
- Хорошее обобщение
- Ускоренное обучение
- Только один скрытый слой
- Высокая устойчивость к входному шуму
- Простая интерпретация значения или функции каждого узла скрытого слоя.
5. В чем разница между RBF и MLP?
Многослойный перцептрон (MLP) и радиальная базисная функция (RBF) — это популярные архитектуры нейронных сетей, называемые сетями прямой связи. Основные различия между RBF и MLP:
MLP состоит из одного или нескольких скрытых слоев, тогда как RBF состоит только из одного скрытого слоя.
Сеть RBF имеет более высокую скорость обучения по сравнению с MLP. В MLP обучение обычно осуществляется посредством обратного распространения ошибки для каждого слоя. Но в RBF обучение может осуществляться либо посредством обратного распространения ошибки, либо посредством гибридного обучения сети RBF.
Программы для Windows, мобильные приложения, игры - ВСЁ БЕСПЛАТНО, в нашем закрытом телеграмм канале - Подписывайтесь:)