Линейная регрессия SAS (с примерами)
Система статистического анализа (SAS) — одна из самых передовых систем программного обеспечения для написания отчетов и анализа данных. Проще говоря, SAS — это группа программ, разработанных для совместной работы и хранения значений данных. Вы можете извлекать эти значения данных, изменять их, выполнять сложный или простой статистический анализ и создавать отчеты.
Станьте экспертом в области науки о данных и получите работу своей мечтыПрограмма аспирантуры Калифорнийского технологического института по науке о данныхИзучить программу
SAS поставляется с моделью линейной регрессии, просто методом анализа взаимосвязи между двумя количественными переменными. Предположим, что есть две переменные, X и Y. Если вы представляете взаимосвязь между этими двумя переменными с помощью линейной функции, то сила воздействия — это наклон функции. Тест, проведенный на наклонах, известен как тест линейного влияния.
В этой статье мы подробно поговорим о линейной регрессии SAS.
Программы для Windows, мобильные приложения, игры - ВСЁ БЕСПЛАТНО, в нашем закрытом телеграмм канале - Подписывайтесь:)
Использование линейной регрессии SAS
Линейная регрессия в SAS — лучший способ определить связь между одной или несколькими независимыми переменными или зависимой переменной. Сначала предлагается модель связи, а затем выполняется оценка значений параметров для разработки уравнения регрессии (оценка).
После этого процесса выполняется ряд тестов, чтобы определить, является ли предложенная модель правильной или нет. Если модель соответствует требованиям, вы можете использовать оцененное уравнение регрессии для прогнозирования значения зависимой переменной в соответствии со значениями независимых переменных.
Синтаксис линейной регрессии SAS:
ДАННЫЕ ПРОЦЕССА РЕГ = dset;
МОДЕЛЬ var_1 = var_2;
где:
- dset — имя набора данных.
- var_1 и var_2 — имена переменных набора данных.
Вот пример, поясняющий использование линейной регрессии SAS:
ПРОЦЕСС SQL;
создать таблицу Shampoo1 как
ВЫБЕРИТЕ тип, название, вес, счет-фактуру
ОТ
SASHELP.BEAUTY_PROD
ГДЕ производится ('Жирные волосы', 'Шампунь с лавандой')
;
БЕГАТЬ;
данные регистрации процедуры = Shampoo1;
Название модели = тип;
бегать;
Как выполнить линейную регрессию SAS
Чтобы выполнить или запустить линейную регрессию SAS, запустите линейную регрессию SAS с процедурой PROC REG. Эта процедура обычно называется процедурой общего назначения для регрессии в SAS.
Процедура PROC REG возвращает наиболее важные параметры и статистику, и поэтому она становится наиболее простым методом программирования.
Вот шаги, которые необходимо выполнить для выполнения линейной регрессии SAS с помощью PROC REG:
- Начните процедуру PROC REG: Сначала вам нужно начать процедуру. Для этого вам нужно использовать оператор PROC REG.
- Определите входной набор данных: Перечислите имя входного набора данных с помощью опции DATA=. Вы можете использовать набор данных из рабочей или постоянной библиотеки.
- Укажите связь между вашими переменными: Определите связь между вашими переменными с помощью оператора MODEL. Оператор начинается с ключевого слова MODEL, зависимой переменной, знака равенства и независимой переменной.
- Завершите и выполните процедуру PROC REG: используйте оператор RUN для завершения и выполнения вашего кода.
При использовании PROC REG для создания линейной модели SAS создает отчет, содержащий дисперсионный анализ, оценки параметров, а также диаграммы рассеяния и гистограммы.
Станьте специалистом по обработке данных с реальным опытомПрограмма магистратуры по обработке данныхИзучить программу
Как запустить простую линейную регрессию с помощью SAS Studio?
Если вам не нравится писать код для запуска простой линейной регрессии, используйте вместо этого SAS Studio. SAS Studio предлагает интерфейс «укажи и щелкни», который проведет вас через создание простой модели линейной регрессии без какого-либо кодирования.
Ниже приведены шаги для запуска простой линейной регрессии с помощью SAS Studio:
1. Откройте задачу линейной регрессии.
Для запуска простой линейной регрессии в SAS Studio используйте задачу «Линейная регрессия». На панели «Задачи и утилиты» вы найдете эту задачу в разделе Задачи > Линейные модели. Щелкните правой кнопкой мыши задачу «Линейная регрессия» и нажмите «Открыть», чтобы создать линейную регрессию.
2. Выберите входной набор данных
После того, как вы открыли задачу линейной регрессии, вы можете легко построить простую линейную регрессию. Для начала выберите входной набор данных.
Выберите входной набор данных на вкладке Данные из опции Данные. Вы можете записать имя своего набора данных или просмотреть его, выбрав значок таблицы. После выбора входного набора данных вы можете добавить фильтры к данным.
3. Выберите зависимую переменную
После выбора входного набора данных вы можете легко определить роли вашей регрессионной модели, т. е. зависимые и независимые переменные. Сначала выберите зависимую переменную.
Вы можете выбрать зависимую переменную, нажав на значок плюса. Новое окно предложит вам список всех числовых переменных, доступных в вашем наборе данных. Выберите любую переменную и нажмите кнопку ОК, чтобы назначить этой переменной роль зависимой переменной.
4. Выберите независимую переменную
Вам необходимо выбрать независимую переменную после определения зависимой переменной. Во-первых, необходимо выбрать числовые переменные, за исключением зависимой переменной, которая входит в модель. Таким образом, очевидно, что это двухэтапная процедура.
Прокрутите вкладку вниз, пока не найдете раздел переменных, который продолжается. Это практический шаг для выбора числовых переменных. Он открывается во всплывающем окне после нажатия на значок плюса. Всплывающее окно состоит из числовых переменных в наборе данных. После выбора соответствующей числовой переменной для модели нажмите кнопку OK.
Примечание: вы могли бы выбрать более одной переменной, но поскольку мы переходим к простой линейной регрессии, мы выберем менее двух переменных.
5. Запустите простую линейную регрессию
Поскольку мы закончили с выбором независимых и зависимых переменных, вы можете запустить или управлять соответствующей моделью. Вы выполняете вышеуказанный шаг, нажав кнопку F3 или Run.
6. Проверьте результаты
Чтобы проверить результат линейной регрессии, щелкните раздел Результаты/Код, а затем выберите вкладку Результаты, чтобы получить фактический результат линейной регрессии.
Вкладка Results показывает результат регрессии модели и показывает несколько графиков и таблиц. Эти графики и таблицы используются для расчета параметров модели. И для перекрестной проверки всех возобновлений линейной модели.
7. Экзамен по коду SAS
Как было сказано ранее, вы должны написать один код, чтобы он мог запустить простую линейную регрессию. Проверьте вкладку Код, если вас интересует код SAS. Здесь вы увидите, что код создается сам по себе, т. е. автоматически.
Другие статистические процедуры (создайте список, в котором вы сможете обсудить среднее арифметическое, стандартное отклонение и т. д.)
Лучший билет на ведущие должности в области науки о данныхПрограмма последипломного образования в области науки о данныхИзучите сейчас
Другие статистические процедуры
Среднее арифметическое – Наиболее часто встречающаяся и простая центральная тенденция – это среднее значение. Значение, полученное путем уменьшения общего количества наблюдений на количество комментариев в наборе данных, является средним значением, и символ x его обозначает. Среднее арифметическое, часто называемое средним значением, является результатом сложения двух чисел или факторов и последующего деления их на общее количество цифр или элементов.
Стандартное отклонение – Стандартное отклонение (или ) – это измерение дисперсии данных пропорционально среднему значению. Данные группируются вокруг среднего значения, когда стандартное отклонение низкое, в то время как данные гораздо более разбросаны, когда стандартное отклонение значительное.
- Наборы данных SAS
- SAS-петли
- Руководство по макросам SAS
- SAS-массивы
- Гистограмма SAS
Вы рассматриваете профессию в области науки о данных? Тогда получите сертификат по программе аспирантуры Caltech в области науки о данных уже сегодня!
Освойте линейную регрессию SAS с помощью Simplilearn
Наука о данных — это фантастический профессиональный путь с большим пространством для прогресса в будущем. Спрос уже высок, заработки конкурентоспособны, а льготы многочисленны. Магистерский курс по науке о данных, предоставляемый Simplilearn, поможет энтузиастам построить более яркую карьеру в этом секторе. Этот курс Data Scientist, спонсируемый IBM, включает уникальные хакатоны IBM, мастер-классы и сессии Ask-Me-Anything.
Станьте специалистом по обработке данных с реальным опытомПрограмма магистратуры по обработке данныхИзучить программу
Эта сертификация по науке о данных также дает вам практический опыт работы с такими технологиями, как Python, R, Tableau, Machine Learning, Spark и Hadoop. Воспользуйтесь преимуществами живого общения с профессионалами, интерактивными лабораториями и проектами, пройдя этот курс по науке о данных онлайн.
Программы для Windows, мобильные приложения, игры - ВСЁ БЕСПЛАТНО, в нашем закрытом телеграмм канале - Подписывайтесь:)