Линейная регрессия SAS (с примерами)

Система статистического анализа (SAS) — одна из самых передовых программных систем для написания отчетов и анализа данных. Проще говоря, SAS — это группа программ, предназначенных для совместной работы и хранения значений данных. Вы можете получать эти значения данных, изменять их, выполнять сложный или простой статистический анализ и создавать отчеты.

Станьте экспертом по науке о данных и получите работу своей мечты. Программа последипломного образования Калифорнийского технологического института по программе Data ScienceExplore.Станьте экспертом по науке о данных и получите работу своей мечты

SAS поставляется с моделью линейной регрессии — просто методом анализа взаимосвязи между двумя количественными переменными. Допустим, есть две переменные, X и Y. Если вы представляете связь между этими двумя переменными с помощью линейной функции, то сила воздействия — это наклон функции. Испытание, проводимое на склонах, известно как испытание на линейное влияние.

В этой статье мы подробно поговорим о линейной регрессии SAS.

Программы для Windows, мобильные приложения, игры - ВСЁ БЕСПЛАТНО, в нашем закрытом телеграмм канале - Подписывайтесь:)

Использование линейной регрессии SAS

Линейная регрессия в SAS — лучший способ определить взаимосвязь между одной или несколькими независимыми переменными или зависимой переменной. Сначала предлагается модель связи, а затем производится оценка значений параметров для построения уравнения регрессии (расчетного).

После этого процесса выполняется ряд тестов, чтобы определить, правильна предложенная модель или нет. Если модель соответствует требованию, вы можете использовать расчетное уравнение регрессии, чтобы спрогнозировать значение зависимой переменной в соответствии со значениями независимых переменных.

Синтаксис линейной регрессии SAS:

ПРОЦ РЕГ ДАННЫЕ = dset;

МОДЕЛЬ var_1 = var_2;

где:

  • dset — это имя набора данных.
  • var_1 и var_2 — это имена переменных набора данных.

Вот пример, объясняющий использование линейной регрессии SAS:

ПРОЦ SQL;

создайте таблицу Shampoo1 как

ВЫБЕРИТЕ тип, название, вес, счет-фактуру

ОТ

САШЕЛП.BEAUTY_PROD

ГДЕ делать («Жирные волосы», «Лавандовый шампунь»)

;

БЕГАТЬ;

данные процедуры регистрации = Шампунь1;

Название модели = тип;

бегать;

Как выполнить линейную регрессию SAS

Чтобы выполнить или запустить линейную регрессию SAS, запустите линейную регрессию SAS с помощью процедуры PROC REG. Эту процедуру обычно называют процедурой общего назначения для регрессии в SAS.

Процедура PROC REG возвращает наиболее важные параметры и статистику, и поэтому она становится наиболее простым методом программирования.

Вот шаги, которые необходимо выполнить для выполнения линейной регрессии SAS с помощью PROC REG:

  • Запустите процедуру PROC REG. Сначала вам необходимо запустить процедуру. Для этого вам нужно использовать оператор PROC REG.
  • Определите входной набор данных: укажите имя входного набора данных, используя опцию DATA=. Вы можете использовать набор данных из работы или постоянной библиотеки.
  • Укажите связь между переменными. Определите связь между переменными с помощью оператора MODEL. Оператор начинается с ключевого слова MODEL, зависимой переменной, знака равенства и независимой переменной.
  • Завершите и реализуйте процедуру PROC REG. Используйте оператор RUN, чтобы завершить и выполнить код.

Когда вы используете PROC REG для создания линейной модели, SAS создает отчет, содержащий дисперсионный анализ, оценки параметров, а также диаграммы рассеяния и гистограммы.

Овладейте наукой о данных и разблокируйте роли высшего уровня с помощью магистерской программы Data ScientistНачните обучениеОвладейте наукой о данных и разблокируйте роли высшего уровня

Как запустить простую линейную регрессию с помощью SAS Studio?

Если вам не нравится писать код для запуска простой линейной регрессии, используйте вместо этого SAS Studio. SAS Studio предлагает интерфейс «укажи и щелкни», который поможет вам построить простую модель линейной регрессии без необходимости написания кода.

Ниже приведены шаги для запуска простой линейной регрессии с помощью SAS Studio:

1. Откройте задачу линейной регрессии.

Для запуска простой линейной регрессии в SAS Studio используйте задачу «Линейная регрессия». На панели «Задачи и утилиты» вы найдете эту задачу в разделе «Задачи» > «Линейные модели». Щелкните правой кнопкой мыши задачу «Линейная регрессия» и нажмите «Открыть», чтобы создать линейную регрессию.

2. Выберите входной набор данных.

После того, как вы открыли задачу «Линейная регрессия», вы можете легко построить простую линейную регрессию. Для начала выберите входной набор данных.

Выберите входной набор данных на вкладке «Данные» в разделе «Данные». Вы можете записать название вашего набора данных или просмотреть его, выбрав значок таблицы. После выбора входного набора данных вы можете добавить фильтры к данным.

3. Выберите зависимую переменную.

После выбора входного набора данных вы можете легко определить роли вашей модели регрессии, т. е. зависимые и независимые переменные. Сначала выберите зависимую переменную.

Вы можете выбрать зависимую переменную, нажав на значок плюса. В новом окне вам будет предложен список всех числовых переменных, доступных в вашем наборе данных. Выберите любую переменную и нажмите кнопку «ОК», чтобы присвоить этой переменной роль зависимой переменной.

4. Выберите независимую переменную.

Вам нужно выбрать независимую переменную после определения зависимой переменной. Во-первых, необходимо выбрать числовые переменные, кроме зависимой переменной, которая входит в модель. Отсюда ясно, что это двухэтапная процедура.

Прокрутите вкладку вниз, пока не найдете раздел переменных, который продолжается. Это практический шаг по выбору числовых переменных. Он открывается во всплывающем окне после нажатия на значок плюса. Всплывающее окно состоит из числовых переменных в наборе данных. После выбора соответствующей числовой переменной для модели нажмите кнопку ОК.

Примечание. Вы могли бы выбрать более одной переменной, но, поскольку мы приближаемся к простой линейной регрессии, мы выберем менее двух переменных.

5. Запустите простую линейную регрессию

Поскольку мы закончили с выбором независимых и зависимых переменных, вы можете запустить или управлять соответствующей моделью. Вы выполняете вышеуказанный шаг, нажав кнопку F3 или «Выполнить».

6. Проверьте результаты

Чтобы проверить результат линейной регрессии, щелкните раздел «Результаты/Код», а затем выберите вкладку «Результаты», чтобы получить фактический результат линейной регрессии.

На вкладке «Результаты» показаны результаты регрессии модели, а также несколько графиков и таблиц. Эти графики и таблицы используются для расчета параметров модели. И перепроверить все возобновления линейной модели.

7. Проверка кода SAS

Как говорилось ранее, вы должны написать один код, чтобы он мог выполнять простую линейную регрессию. Проверьте вкладку «Код», если вас интересует код SAS. Здесь вы увидите, что код создается сам по себе, т. е. автоматически.

Другие статистические процедуры (составьте список, в котором вы сможете обсудить среднее арифметическое, стандартное отклонение и т. д.)

Станьте самым высокооплачиваемым экспертом по науке о данных с нашей лучшей в своем классе программой по науке о данныхИзучите сейчасСтаньте самым высокооплачиваемым экспертом по науке о данных

Другие статистические процедуры

Арифметические средние. Наиболее часто встречающейся и простой центральной тенденцией является среднее значение. Значение, полученное путем уменьшения общего количества наблюдений на количество комментариев в наборе данных, является средним значением, и его символизирует символ x. Среднее арифметическое, часто известное как среднее или среднее значение, представляет собой результат сложения двух чисел или коэффициентов и последующего деления их на общее количество цифр или элементов.

Стандартное отклонение. Стандартное отклонение (или ) — это измерение дисперсии данных пропорционально среднему значению. Данные группируются вокруг среднего значения, когда стандартное отклонение низкое, тогда как данные гораздо более разбросаны, когда стандартное отклонение значительно.

  1. Наборы данных SAS
  2. Петли SAS
  3. Руководство по макросам SAS
  4. SAS-массивы
  5. Гистограмма САС

Вы рассматриваете профессию в области Data Science? Тогда получите сертификат по программе последипломного образования Калифорнийского технологического института в области науки о данных сегодня!

Освойте линейную регрессию SAS с помощью Simplilearn

Наука о данных — это фантастический профессиональный путь с большим потенциалом для прогресса в будущем. Спрос уже высок, доходы конкурентоспособны, а выгоды многочисленны. Магистерский курс по науке о данных, предоставляемый Simplilearn, поможет энтузиастам сделать более блестящую карьеру в этом секторе. Этот курс Data Scientist, спонсируемый IBM, включает в себя уникальные хакатоны IBM, мастер-классы и сеансы «Спроси меня о чем-нибудь».

Овладейте наукой о данных и разблокируйте роли высшего уровня с помощью магистерской программы Data ScientistНачните обучениеОвладейте наукой о данных и разблокируйте роли высшего уровня

Этот сертификат Data Science также дает вам практический опыт работы с такими технологиями, как Python, R, Tableau, Machine Learning, Spark и Hadoop. Воспользуйтесь преимуществами живого контакта с профессионалами, интерактивными лабораториями и проектами, пройдя онлайн-курс по науке о данных.

Программы для Windows, мобильные приложения, игры - ВСЁ БЕСПЛАТНО, в нашем закрытом телеграмм канале - Подписывайтесь:)

Похожие записи

Добавить комментарий

Ваш адрес email не будет опубликован. Обязательные поля помечены *