Наборы данных SAS с примерами

SAS (программное обеспечение для статистического анализа) — это популярное программное обеспечение для анализа данных, которое может манипулировать, анализировать, организовывать и извлекать данные из различных источников, а также выполнять статистический анализ. Бизнес-моделирование, статистический анализ, управление данными, написание отчетов, хранение данных и разработка приложений — вот некоторые из других приложений.

Для нетехнических пользователей он имеет графический пользовательский интерфейс «укажи и щелкни», а также более сложные варианты выбора с помощью языка SAS. Это полезный инструмент, позволяющий применять качественные подходы и процедуры для повышения производительности персонала и прибыли компании.

SAS извлекает и классифицирует данные по таблицам, что позволяет выявлять и анализировать тенденции данных. Этот пакет программного обеспечения позволяет вам управлять сложным анализом, прогнозным анализом, бизнес-аналитикой и данными для эффективной работы в конкурентной и меняющейся корпоративной среде. SAS также не зависит от платформы, что означает, что он может работать в любой операционной системе, включая Linux, Windows, Mac, Ubuntu и другие.

В этой статье мы подробно обсудим встроенные и специальные наборы данных SAS в SAS.

Программы для Windows, мобильные приложения, игры - ВСЁ БЕСПЛАТНО, в нашем закрытом телеграмм канале - Подписывайтесь:)

Что такое набор данных SAS?

Набор данных состоит из переменных вместе с их значениями, которые часто называют значениями данных или наблюдениями. Внутри таблицы набор данных содержит и упорядочивает значения данных в виде строк и столбцов. Строки в SAS называются наблюдениями, а столбцы — переменными SAS.

Набор данных состоит из переменных и их значений, которые часто называют значениями данных или наблюдениями. Внутри таблицы набор данных содержит и упорядочивает значения данных в виде столбцов и строк. Столбцы известны как переменные SAS, а строки — как наблюдения в SAS.

Переменная (или столбец)

В представлении таблицы SAS каждый столбец обозначает переменную. Столбцы или переменные в приведенной выше области изображения — это продукт, размер города, население и тип масштаба.

Строки (или наблюдение)

В табличном представлении набора данных SAS каждая строка демонстрирует наблюдение.

Читайте также: Заработная плата SAS по всему миру

Части набора данных SAS

Части набора данных SAS включают следующее:

  1. Встроенные наборы данных
  2. Дескрипторная часть
  3. Специальные наборы данных SAS
  4. Часть данных

Давайте теперь посмотрим на них подробно.

Встроенные наборы данных SAS

В программном обеспечении SAS в библиотеке SAS уже есть несколько наборов данных, которые можно использовать для выполнения, анализа и создания примеров программ. Все наборы данных сохраняются в SASHELP в моих библиотеках.

SAS_Data_Sets_1

Теперь, когда мы хотим использовать набор данных CARS, дважды щелкните его, чтобы открыть панель в правой части окна SAS. Набор данных CARS, который имеет встроенный набор данных в библиотеке SAS, показан ниже.

SAS_Data_Sets_2.

Часть дескриптора SAS

Раздел дескриптора набора данных содержит важную информацию, такую ​​как время и дата самых последних наблюдений, количество наблюдений, переменных и модификаций в наборе данных и многое другое. Рассмотрим таблицу ниже, которая является примером дескриптора work.grad из набора данных SAS.

SAS_Data_Sets_3.

Специальные наборы данных SAS

Процессы SAS предоставляют настроенные наборы данных, которые обычно могут использоваться другими процедурами без прямых манипуляций.

Существует два типа специальных наборов данных SAS:

  1. Наборы данных по умолчанию
  2. НУЛЕВЫЕ наборы данных

Наборы данных по умолчанию

SAS может вызвать предыдущий набор данных, используя зарезервированное слово _LAST_. Если вы не объявите набор данных перед выполнением шага DATA или PROC, SAS будет использовать последний запущенный вами набор данных. Это известно как наборы данных по умолчанию.

Синтаксис

ДАННЫЕ_;

НУЛЕВЫЕ наборы данных

В других обстоятельствах мы можем захотеть выполнить шаг данных, но не создавать никаких наборов данных. В таких ситуациях мы можем использовать _NULL_. Следующий оператор создает шаг данных без создания каких-либо наборов данных.

Синтаксис

ДАННЫЕ _null_;

Часть данных

Часть данных состоит из значений данных набора данных SAS. Значения данных организованы в виде таблицы. Значения наблюдения данных переменных находятся в строке, а данные переменные находятся в столбце. Иллюстрация показана ниже:

Допустим, есть набор данных студентов.

Студент ДАТА;

SAS_Data_Sets_4

Набор данных SAS содержит четыре переменные (номер рулона, имя, класс и высота), каждая из которых содержит четыре числа значений наблюдений, например значения номера рулона 101, 102, 103 и 104; Значения имен Субхаш, Намрита, Прити и Сушма; Значения класса 12, 10, 12 и 10; Значения высоты 155, 154, 156 и 153. Набор данных представляет собой целую таблицу, а значения данных представляют собой объединение наблюдений и переменных. В данных SAS можно хранить любое количество наблюдений и переменных.

Импорт внешних наборов данных

Есть два метода, с помощью которых мы можем импортировать внешние данные в SAS:

  1. ПРОЦ-импорт
  2. Получить внешний файл с помощью INFILE

ПРОЦ-импорт

Метод PROC в SAS автоматизирует процесс импорта внешнего набора данных. При импорте внешнего файла этим методом нам не нужно указывать длину и тип переменной. Этот метод поддерживает различные форматы, такие как txt, csv, excel и т. д.

Импорт файла, содержащего несколько разделителей

При использовании двух или более разделителей, таких как запятые и табуляции, ставьте их в кавычки после разделителя = опция.

Пример

PROC IMPORT DATAFILE = “C:\Simplilearn\sample.txt”

ВЫХОД = устаревшие данные

СУБД=dlm

ЗАМЕНЯТЬ;

разделитель =','09'x';

GETNAMES=ДА;

БЕГАТЬ;

Импорт файла, разделенного запятыми, с расширением CSV

Укажите DBMS= CSV, чтобы получить файл, разделенный запятыми, в SAS.

Пример

PROC IMPORT DATAFILE = “C:\Simplilearn\sample.txt”

ВЫХОД = устаревшие данные

СУБД=csv

ЗАМЕНЯТЬ;

GETNAMES=ДА;

БЕГАТЬ;

Импорт файла, разделенного табуляцией, в SAS

Код для импорта файла Excel идентичен коду ниже. Разница в том, что разделитель = '09'x и СУБД = DLM.

Пример

PROC IMPORT DATAFILE = “C:\Simplilearn\sample.txt”

ВЫХОД = устаревшие данные

СУБД=dlm

ЗАМЕНЯТЬ;

разделитель = '09'x;

GETNAMES=ДА;

БЕГАТЬ;

Импорт файла, разделенного запятыми, с расширением TXT

Укажите разделитель = ',', чтобы получить расширение txt, содержащее файл, разделенный запятыми, в SAS.

Пример

PROC IMPORT DATAFILE = “C:\Simplilearn\sample.txt”

ВЫХОД = устаревшие данные

СУБД=dlm

ЗАМЕНЯТЬ;

разделитель = ',';

GETNAMES=ДА;

БЕГАТЬ;

Импорт файла, разделенного пробелами

Если вы хотите извлечь файл с разделителем-пробелом, используйте разделитель = '20'x.

Пример

PROC IMPORT DATAFILE = “C:\Simplilearn\sample.txt”

ВЫХОД = устаревшие данные

СУБД=dlm

ЗАМЕНЯТЬ;

разделитель = '20'x;

GETNAMES=ДА;

БЕГАТЬ;

Импорт файла Excel в SAS

Важные ключевые слова, используемые в программе, приведены ниже:

  1. GETNAMES — используется для включения первой строки имен переменных данных.
  2. REPLACE — используется для перезаписи уже существующего набора данных SAS.
  3. OUT — используется для указания имени набора данных, созданного SAS. Outdata — это набор данных, который сохраняется в рабочей библиотеке приложения ниже (временная библиотека).
  4. ЛИСТ — импортирует один лист из книги Excel.
  5. СУБД — используется для указания типа данных для импорта.

Пример

PROC IMPORT DATAFILE=”c:\Simplilearn\sample.xls”

ВЫХОД = устаревшие данные

СУБД=xls

ЗАМЕНЯТЬ;

ЛИСТ=”Лист1″;

GETNAMES=ДА;

БЕГАТЬ;

Использование INFILE — получение внешнего файла

Используя метод INFILE, мы можем вручную импортировать внешние файлы в SAS. При этом нам нужно указать длину и типы переменной.

Импорт файла с разделителями TAB

Чтобы сообщить SAS, что импортируется файл с разделителями табуляции, мы можем использовать DLM='09'x. Даже если значение короче, чем ожидает оператор INPUT, оператор TRUNCOVER дает указание SAS присвоить переменной значение необработанных данных.

Пример

данные устарели;

infile 'C:\Simplilearn\sample.txt' DSD dlm='09'x truncover;

входной сотрудник: 30$. МЮ :mmddyy8. штат: 20$.;

бегать;

Импорт файла CSV

Следующие ключевые слова учитываются при импорте файла CSV с использованием INFILE:

Оператор INFILE — используется для указания местоположения файла данных.

DSD — изменить разделитель по умолчанию с пробела на запятую.

FIRSTOBS=2: это сообщает SAS, что вторая строка содержит значения данных, а первая строка содержит имена переменных.

Пример

данные устарели;

infile 'C:\Users\Simplilearn\documents\book1.csv' dsd firstobs=2;

входной идентификатор возраст пол $ dept $;

бегать;

  1. Петли SAS
  2. Руководство по макросам SAS
  3. SAS-массивы
  4. Линейная регрессия SAS
  5. Гистограмма САС

Выберите правильную программу

Вы с нетерпением ждете науки о данных? Наши курсы по науке о данных созданы для того, чтобы дать вам необходимые навыки и знания для достижения успеха в этой быстро развивающейся области. Чтобы помочь вам лучше понять, мы предоставили подробное сравнение.

Название программыМагистерская программа Data ScientistПоследипломная программа в области науки о данныхПоследипломная программа в области науки о данных
ГеоВсе регионыВсе регионыНе применимо в США
УниверситетПростое обучениеПердьюКалтех
Продолжительность курса11 месяцев11 месяцев11 месяцев
Требуется опыт кодированияБазовыйБазовыйНет
Навыки, которые вы изучитеБолее 10 навыков, включая структуру данных, манипулирование данными, NumPy, Scikit-Learn, Tableau и многое другое.8+ навыков, включая
Исследовательский анализ данных, описательная статистика, логическая статистика и многое другое.
8+ навыков, включая
Контролируемое и неконтролируемое обучение
Глубокое обучение
Визуализация данных и многое другое.
Дополнительные преимуществаПрикладное обучение через Capstone и более 25 проектов по науке о данныхЧленство в Ассоциации выпускников Purdue
Бесплатное членство IIMJobs Pro на 6 месяцев
Возобновить помощь в построении
До 14 кредитов CEU Членство в кружке Caltech CTME
Расходы$$$$$$$$$$
Изучите программуИзучите программуИзучите программу

Освойте SAS с помощью Simplilearn

SAS — довольно популярное программное обеспечение для анализа данных, которое аналитики данных и специалисты по данным используют для анализа данных путем манипулирования таблицами базы данных и выполнения различных операций с данными. Наборы данных SAS используются в этих операциях и состоят из следующих частей:

  1. Наборы данных по умолчанию
  2. Встроенные наборы данных
  3. Специальные наборы данных
  4. Дескрипторная часть
  5. Часть данных

В этой статье мы обсудили, что такое наборы данных SAS, и кратко описали различные части наборов данных SAS. Чтобы получить более глубокие знания в этой области, а также понять и изучить полные концепции, связанные с наукой о данных, с нуля, Simplilearn предлагает комплексную сертификацию по науке о данных для энтузиастов, которые хотят построить карьеру в области науки о данных и иметь возможность использовать замечательные программные системы, такие как как SAS для манипулирования данными и выполнения операций с ними.

Программы для Windows, мобильные приложения, игры - ВСЁ БЕСПЛАТНО, в нашем закрытом телеграмм канале - Подписывайтесь:)

Похожие записи

Добавить комментарий

Ваш адрес email не будет опубликован. Обязательные поля помечены *