10 основных терминов машинного обучения, которые вам нужно знать

Машинное обучение — ключевой термин в технологии, часто связанный с искусственным интеллектом, глубоким обучением и большими данными. Но что это на самом деле означает? Кроме того, какие еще важные термины в машинном обучении следует понимать?

Машинное обучение предполагает повышение точности системы, поскольку со временем она получает больше данных и обратной связи. Многие случаи машинного обучения происходят в нашей повседневной жизни без нашего ведома. Например, предложения Facebook «Люди, которых вы можете знать» или рекомендации Amazon по продуктам, основанные на предыдущих покупках, основаны на алгоритмах машинного обучения для адаптации результатов.

В области искусственного интеллекта машинное обучение продвигает эту область, позволяя компьютерам «обучаться» независимо. Первоначально в области искусственного интеллекта исследователи установили правила, по которым компьютеры могли принимать решения. Однако благодаря машинному обучению компьютеры самостоятельно обучаются и создают новые правила посредством практики и повторения.

Основные термины машинного обучения

Внедрение машинного обучения в больших масштабах сопряжено с трудностями. Переоснащение, когда машина слишком сильно полагается на исторические данные, не адаптируясь к новым переменным, является проблемой. Кроме того, получение достаточно больших выборок данных для обучающих машин может быть затруднено.

Программы для Windows, мобильные приложения, игры - ВСЁ БЕСПЛАТНО, в нашем закрытом телеграмм канале - Подписывайтесь:)

Несмотря на опасения, что машинное обучение заменит людей, оба могут по-разному дополнять друг друга. Harvard Business Review отмечает, что благодаря совместному интеллекту люди и ИИ усиливают сильные стороны друг друга: такие человеческие качества, как командная работа, креативность, лидерство и социальные навыки, дополняют масштабируемость, скорость и количественные возможности ИИ.

Люди играют решающую роль в обучении, эксплуатации и объяснении поведения машин. Например, когда Microsoft разработала бота ML Cortana, для создания его личности — «уверенного в себе, заботливого и полезного, но не властного» — потребовались существенные данные и человеческое понимание. Команда, в которую вошли поэт, писатель и драматург, обучила бота эффективному общению с людьми.

Классификация

Классификация, компонент обучения с учителем, использующий размеченные данные, включает в себя категоризацию входных данных по отдельным категориям. В рамках машинного обучения классификация может включать бинарные классификаторы с двумя результатами (например, спам или не-спам) или многоклассовые классификаторы, различающие различные категории, такие как типы книг или виды животных.

Широко используемым алгоритмом классификации является дерево решений, которое имеет решающее значение как для специалистов по данным, так и для инженеров по машинному обучению. Он задает последовательные вопросы для достижения точной классификации, постепенно создавая структуру «если-то», которая уточняет возможности.

Кластеризация

Кластеризация из глоссария машинного обучения — это метод обучения без учителя, который использует немаркированные данные для группировки точек данных на основе их функций и атрибутов.

Он находит применение в различных сферах:

  • Организация демографических данных клиентов и покупательского поведения в целевых сегментах маркетинга и продакт-плейсмента.
  • Анализ качества жилья и географических данных для оценки недвижимости и планирования городского развития.
  • Категоризация информации в библиотеках или на веб-страницах для создания удобных каталогов по темам.

Кластеризация K-средних, наиболее распространенный тип кластеризации, включает в себя представление кластеров с использованием переменной «k» и определение их центроидов. Каждая точка данных присваивается определенному кластеру, что приводит к идентификации новых центроидов кластера. Практические примеры приложений кластеризации K-средних включают в себя:

  • Больница стремится разместить отделения неотложной помощи как можно ближе к районам с частыми несчастными случаями.
  • Сейсмолог, изучающий сейсмоопасные регионы, чтобы определить зоны повышенного риска на основе исторических событий.
  • Пиццерия стратегически расположила магазины с учетом спроса клиентов, чтобы минимизировать расстояние доставки для водителей.

Другие методы кластеризации, такие как иерархическая, плотность, сетка и секционирование, предоставляют альтернативные подходы к задачам кластеризации.

Регрессии

Регрессия устанавливает связи и корреляции между различными типами данных. Например, при анализе изображений изображения профиля состоят из пикселей, представляющих отдельных лиц. Благодаря машинному обучению распознавание определенных расположений пикселей, соответствующих имени человека, позволяет распознавать лица, например, когда Facebook предлагает теги для недавно загруженных фотографий.

Регрессия также помогает прогнозировать результаты с использованием имеющихся данных. Исторически его применяли для решения различных задач, таких как прогнозирование восстановления когнитивных функций после инсульта или прогнозирование оттока клиентов в телекоммуникационном секторе. Разница теперь заключается в эффективности и скорости, с которой машины могут более эффективно выполнять этот регрессионный анализ.

Регрессия, структурированный алгоритм машинного обучения, включает в себя маркировку входных и выходных данных. Линейная регрессия создает непрерывные выходные переменные (значения в пределах диапазона), которые обычно используются в таких сценариях, как данные о ценах. Логистическая регрессия имеет дело с категориальными зависимыми переменными и точно определенными помеченными переменными. Например, он классифицирует, открыт ли магазин, как (1) или (0), при этом существуют только две возможности.

Глубокое обучение

Глубокое обучение, расширение машинного обучения, имитирует функциональность человеческого мозга. Глубокое обучение использует нейронные сети для обработки крупномасштабных данных (как структурированных, так и неструктурированных) и выявления закономерностей в них. Точность и понимание решений, принимаемых сетями глубокого обучения, возрастают с увеличением объема данных, на которых они могут учиться.

Примеры приложений глубокого обучения в действии включают в себя:

  1. Чат-боты и виртуальные помощники. Виртуальные помощники на базе искусственного интеллекта, такие как Siri, Alexa и чат-боты службы поддержки клиентов, расшифровывают человеческие запросы и предоставляют реалистичные ответы.
  2. Ставки в режиме реального времени и программная реклама. Такие платформы, как Cognitiv AI, используют глубокое обучение для синтеза данных о демографии клиентов, наличии запасов, погоде и других переменных, создавая индивидуальные алгоритмы покупки для целевых рынков в конкурентном рекламном пространстве.
  3. Механизмы рекомендаций. Туристические сайты, такие как booking.com, потоковые платформы, такие как Netflix, и музыкальные сервисы, такие как Spotify, используют глубокое обучение в механизмах рекомендаций. Эти механизмы настраивают маркетинг, изучая прошлое поведение пользователей, используя совместные методы, которые анализируют предпочтения пользователей в масштабе, или фильтрацию на основе контента, которая сравнивает свойства элементов, чтобы предложить наиболее близкие совпадения.

Нейронные сети

Нейронные сети, тесно связанные с глубоким обучением, создают последовательные слои нейронов, чтобы улучшить понимание данных для точного анализа.

Нейронная сеть, состоящая из слоев узлов, получает входные данные, которые стимулируют эти узлы. Коэффициенты присваивают вес этим данным, поскольку некоторые входные данные могут иметь большее значение, чем другие, в сетевом анализе.

Обычно нейроны разделены на три слоя: входной слой, скрытый слой, выполняющий математические вычисления, и выходной слой. Например, при оценке цен на авиабилеты входной слой будет собирать такие данные, как аэропорт отправления, аэропорт назначения, дата вылета и авиакомпания. Каждому входному значению будет присвоен вес (с учетом таких факторов, как значимость даты вылета для авиакомпании), а выходной слой будет предоставлять прогнозируемую цену билета на основе этих взвешенных входных данных.

Обработка естественного языка

Обработка естественного языка (НЛП), важнейшая область ИИ, фокусируется на обработке человеческих языков. Однако серьезная проблема заключается в том, что человеческая речь не всегда буквальна. Он включает в себя диалектную терминологию машинного обучения, фигуры речи, культурные нюансы и предложения, значения которых различаются из-за грамматики и пунктуации. Как и в человеческих разговорах, системы НЛП должны учитывать синтаксис (расположение слов) и семантику (значение расположения) для точной интерпретации языка.

Начальный этап обработки естественного языка включает преобразование неструктурированных языковых данных в формат, читаемый компьютером. Затем используются алгоритмы, чтобы придать значение каждому предложению, что приводит к его переводу в другую форму, например, преобразованию речи в текст или переводу между языками.

Обработка естественного языка служит различным целям в разных приложениях, помогая платформам перевода, таким как инструменты для совместной работы, такие как Slack и Microsoft Word, Google Translate и виртуальные помощники.

Например, Королевский банк Шотландии использует текстовую аналитику в своей системе обслуживания клиентов. Анализируя жалобы, полученные из электронной почты и колл-центров, они выявляют конкретные проблемы, что позволяет целенаправленно улучшить свои отношения и управление репутацией.

Машинное зрение

Машинное зрение, также известное как компьютерное зрение, предполагает, что машины захватывают и анализируют изображения. Эта возможность облегчает такие задачи, как диагностика рака кожи путем изучения рентгеновских лучей и медицинских изображений, а также обнаружение дорожного движения в реальном времени и идентификация типов транспортных средств, что имеет решающее значение для развития беспилотных автомобилей, таких как последние модели Tesla.

Машины используют различные методы «видения», такие как числовое представление цветов, разбиение изображений на отдельные компоненты и распознавание краев, углов и текстур. По мере того, как машины накапливают и интерпретируют больше данных, они постепенно получают более широкое представление об общей картине.

Текущие тенденции в области машинного зрения включают интеграцию в промышленный Интернет вещей (IIoT), включающий сбор сенсорных данных и производительность в заводских условиях. Кроме того, машинное зрение распространяется и на непромышленные отрасли, такие как автономное сельскохозяйственное оборудование, беспилотные автомобили, интеллектуальные системы дорожного движения, применение дронов и управляемая хирургия.

Инженер по машинному обучению

Инженеры по машинному обучению часто несут первоначальную ответственность за внедрение машинного обучения в компаниях. Эти профессионалы являются разработчиками программного обеспечения, управляемыми данными, которые создают системы, способные к независимому обучению и выполнению задач. Обычно они обладают различными базами кода, навыками манипулирования данными, распределенными вычислениями и знаниями в области компьютерных наук.

Программы для Windows, мобильные приложения, игры - ВСЁ БЕСПЛАТНО, в нашем закрытом телеграмм канале - Подписывайтесь:)

Похожие записи

Добавить комментарий

Ваш адрес email не будет опубликован. Обязательные поля помечены *