Наборы данных SAS с примерами

SAS (Statistical Analysis Software) — популярное программное обеспечение для анализа данных, которое может манипулировать, добывать, организовывать и извлекать данные из различных источников, а также выполнять статистический анализ. Бизнес-моделирование, статистический анализ, управление данными, написание отчетов, хранение данных и разработка приложений — вот некоторые из других приложений.

Для нетехнических пользователей он имеет графический пользовательский интерфейс point-and-click, а также более сложные варианты выбора через язык SAS. Это полезный инструмент, который позволяет применять качественные подходы и процедуры для повышения производительности персонала и корпоративной прибыли.

SAS извлекает и классифицирует данные в таблицы, позволяя вам обнаруживать и анализировать тенденции данных. Этот программный пакет позволяет вам управлять сложным анализом, предиктивным анализом, бизнес-аналитикой и данными для эффективной работы в конкурентной и меняющейся корпоративной среде. SAS также является платформенно-нейтральным, что означает, что он может работать на любой операционной системе, включая Linux, Windows, Mac, Ubuntu и другие.

В этой статье мы подробно обсудим встроенные и специальные наборы данных SAS.

Программы для Windows, мобильные приложения, игры - ВСЁ БЕСПЛАТНО, в нашем закрытом телеграмм канале - Подписывайтесь:)

Что такое набор данных SAS?

Набор данных состоит из переменных вместе с их значениями, которые часто называют значениями данных или наблюдениями. В таблице набор данных содержит и упорядочивает значения данных в виде строк и столбцов. Строки известны как наблюдения в SAS, а столбцы известны как переменные SAS.

Набор данных состоит из переменных и их значений, которые часто называют значениями данных или наблюдениями. В таблице набор данных содержит и упорядочивает значения данных в виде столбцов и строк. Столбцы называются переменными SAS, а строки называются наблюдениями в SAS.

Переменная (или столбец)

В представлении таблицы SAS каждый столбец обозначает переменную. Столбцы или переменные в области изображения выше — это продукт, размер города, население и тип масштаба.

Ряды (или наблюдение)

В табличном представлении набора данных SAS каждая строка отображает наблюдение.

Читайте также: Зарплата SAS по всему миру

Части набора данных SAS

Части набора данных SAS включают в себя следующее:

  1. Встроенные наборы данных
  2. Часть дескриптора
  3. Специальные наборы данных SAS
  4. Часть данных

Давайте теперь рассмотрим их подробнее.

Встроенные наборы данных SAS

В программном обеспечении SAS есть несколько наборов данных, которые уже находятся в библиотеке SAS, которые можно использовать для выполнения, анализа и генерации примеров программ. Все наборы данных сохранены в SASHELP в моих библиотеках.

SAS_Data_Sets_1

Теперь, когда мы хотим использовать набор данных CARS, дважды щелкните по нему, чтобы открыть панель в правой части окна SAS. Набор данных CARS, имеющий встроенный набор данных в библиотеке SAS, показан ниже.

SAS_Data_Sets_2.

Часть дескриптора SAS

Раздел дескриптора набора данных содержит важную информацию, такую ​​как время и дата последнего, количество наблюдений, переменных и изменений в наборе данных и многое другое. Рассмотрим таблицу ниже, которая является примером дескриптора work.grad из набора данных SAS.

SAS_Data_Sets_3.

Специальные наборы данных SAS

Процессы SAS предоставляют настраиваемые наборы данных, которые обычно могут использоваться другими процедурами без непосредственного манипулирования.

Существует два вида специальных наборов данных SAS:

  1. Наборы данных по умолчанию
  2. Наборы данных NULL

Наборы данных по умолчанию

SAS может вызвать предыдущий набор данных, используя зарезервированное слово _LAST_. Если вы не объявите набор данных перед запуском шага DATA или PROC, SAS будет использовать последний запущенный вами набор данных. Это известно как наборы данных по умолчанию.

Синтаксис

ДАННЫЕ_;

Наборы данных NULL

В других обстоятельствах мы можем захотеть запустить шаг данных, но не создавать никаких наборов данных. В таких ситуациях мы можем использовать _NULL_. Следующий оператор создает шаг данных, не создавая никаких наборов данных.

Синтаксис

ДАННЫЕ _null_;

Часть данных

Часть данных состоит из значений данных набора данных SAS. Значения данных организованы в табличном формате. Значения наблюдений заданных переменных находятся в строке, а заданные переменные — в столбце. Иллюстрация показана ниже:

Предположим, есть набор данных о студентах.

студент ДАННЫХ;

SAS_Data_Sets_4

Набор данных SAS имеет четыре переменные (Roll Number, Name, Class и Height), каждая с четырьмя числами значений наблюдений, например, значения Roll Number 101, 102, 103 и 104; значения Name Subhash, Namrita, Preeti и Sushma; значения Class 12, 10, 12 и 10; значения Height 155, 154, 156 и 153. Набор данных представляет собой целую таблицу, а значения данных являются слиянием наблюдений и переменных. В данных SAS может храниться любое количество наблюдений и переменных.

Импорт внешних наборов данных

Существует два способа импорта внешних данных в SAS:

  1. PROC-импорт
  2. Получить внешний файл с помощью INFILE

PROC-импорт

Метод PROC в SAS автоматизирует процесс импорта внешнего набора данных. При импорте внешнего файла с помощью этого метода нам не нужно упоминать длину и тип переменной. Этот метод поддерживает различные форматы, такие как txt, csv, excel и т. д.

Импорт файла, содержащего несколько разделителей

При использовании двух или более разделителей, таких как запятые и табуляции, заключите их в кавычки после delimiter = option

Пример

PROC IMPORT DATAFILE= “C:\Simplilearn\sample.txt”

OUT= outdata

СУБД=dlm

ЗАМЕНЯТЬ;

разделитель=','09'x ';

GETNAMES=ДА;

БЕГАТЬ;

Импорт файла с разделителями-запятыми и расширением CSV

Укажите DBMS=CSV, чтобы получить файл с разделителями-запятыми в SAS.

Пример

PROC IMPORT DATAFILE= “C:\Simplilearn\sample.txt”

OUT= outdata

СУБД=csv

ЗАМЕНЯТЬ;

GETNAMES=ДА;

БЕГАТЬ;

Импорт файла с разделителями табуляции в SAS

Код для импорта файла Excel идентичен коду ниже. Разница в том, что разделитель = '09'x и СУБД = DLM.

Пример

PROC IMPORT DATAFILE= “C:\Simplilearn\sample.txt”

OUT= outdata

СУБД=dlm

ЗАМЕНЯТЬ;

разделитель='09'x;

GETNAMES=ДА;

БЕГАТЬ;

Импорт файла с разделителями-запятыми и расширением TXT

Укажите разделитель = ',', чтобы получить расширение txt, содержащее файл, разделенный запятыми, в SAS.

Пример

PROC IMPORT DATAFILE= “C:\Simplilearn\sample.txt”

OUT= outdata

СУБД=dlm

ЗАМЕНЯТЬ;

разделитель=',';

GETNAMES=ДА;

БЕГАТЬ;

Импорт файла, разделенного пробелами

Если вы хотите извлечь файл с разделителем-пробелом, используйте delimiter = '20'x.

Пример

PROC IMPORT DATAFILE= “C:\Simplilearn\sample.txt”

OUT= outdata

СУБД=dlm

ЗАМЕНЯТЬ;

разделитель='20'x;

GETNAMES=ДА;

БЕГАТЬ;

Импорт файла Excel в SAS

Ниже приведены важные ключевые слова, используемые в программе:

  1. GETNAMES — используется для включения первой строки имен переменных данных.
  2. REPLACE — используется для перезаписи уже существующего набора данных SAS.
  3. OUT – Используется для указания имени набора данных, созданного SAS. Outdata – это набор данных, который сохраняется в рабочей библиотеке в приложении ниже (временная библиотека)
  4. ЛИСТ — импортирует один лист из книги Excel.
  5. СУБД — используется для указания типа импортируемых данных.

Пример

PROC IMPORT DATAFILE= “c:\Simplilearn\sample.xls”

OUT= outdata

СУБД=xls

ЗАМЕНЯТЬ;

ЛИСТ=”Лист1″;

GETNAMES=ДА;

БЕГАТЬ;

Использование INFILE — получение внешнего файла

Используя метод INFILE, мы можем вручную импортировать внешние файлы на SAS. При этом нам нужно указать длину и типы переменной.

Импорт файла с разделителями TAB

Чтобы сообщить SAS, что импортируется файл с разделителями табуляции, мы можем использовать DLM='09'x. Даже если значение короче, чем ожидает оператор INPUT, оператор TRUNCOVER дает SAS указание присвоить переменной необработанное значение данных.

Пример

данные устарели;

входящий файл 'C:\Simplilearn\sample.txt' DSD dlm='09'x truncover;

ввод сотрудник: 30 долл. США. DOJ: ммддгг8. штат: 20 долл. США.;

бегать;

Импорт CSV-файла

При импорте CSV-файла с помощью INFILE учитываются следующие ключевые слова:

Оператор INFILE — используется для указания местоположения файла данных.

DSD — для изменения разделителя по умолчанию с пробела на запятую.

FIRSTOBS=2: это сообщает SAS, что вторая строка содержит значения данных, а первая строка содержит имена переменных.

Пример

данные устарели;

входящий файл 'C:\Users\Simplilearn\documents\book1.csv' dsd firstobs=2;

входной идентификатор возраст пол $ отдел $;

бегать;

  1. SAS-петли
  2. Руководство по макросам SAS
  3. SAS-массивы
  4. Линейная регрессия SAS
  5. Гистограмма SAS

Выберите правильную программу

Вы с нетерпением ждете науки о данных? Наши курсы по науке о данных специально разработаны, чтобы снабдить вас необходимыми навыками и знаниями для успеха в этой быстро развивающейся области. Чтобы помочь вам лучше понять, мы предоставили всестороннее сравнение.

Название программыМагистерская программа «Специалист по данным»Программа последипломного образования в области науки о данныхПрограмма последипломного образования в области науки о данных
ГеоВсе ГеоВсе ГеоНе применимо в США.
УниверситетSimplelearnПердьюКалтех
Продолжительность курса11 месяцев11 месяцев11 месяцев
Требуется опыт кодированияБазовыйБазовыйНет
Навыки, которые вы приобрететеБолее 10 навыков, включая структуру данных, обработку данных, NumPy, Scikit-Learn, Tableau и многое другое8+ навыков, включая
Исследовательский анализ данных, описательная статистика, выводная статистика и многое другое
8+ навыков, включая
Контролируемое и неконтролируемое обучение
Глубокое обучение
Визуализация данных и многое другое
Дополнительные преимуществаПрикладное обучение через Capstone и более 25 проектов по науке о данныхЧленство в Ассоциации выпускников Пердью
Бесплатное членство IIMJobs Pro на 6 месяцев
Помощь в составлении резюме
До 14 кредитов CEU Членство в кружке Caltech CTME
Расходы$$$$$$$$$$
Программа исследованияПрограмма исследованияПрограмма исследования

Освойте SAS с Simplilearn

SAS — довольно популярное программное обеспечение для анализа данных, которое аналитики данных и специалисты по данным используют для анализа данных, манипулируя таблицами базы данных и выполняя различные операции с данными. Наборы данных SAS используются в этих операциях и состоят из следующих частей:

  1. Наборы данных по умолчанию
  2. Встроенные наборы данных
  3. Специальные наборы данных
  4. Часть дескриптора
  5. Часть данных

В этой статье мы обсудили, что именно представляют собой наборы данных SAS, и кратко описали различные части наборов данных SAS. Чтобы получить более глубокие знания относительно того же самого и понять и изучить полные концепции, связанные с наукой о данных с нуля, Simplilearn предлагает комплексную сертификацию по науке о данных для энтузиастов, которые хотят построить карьеру в науке о данных и уметь использовать замечательные программные системы, такие как SAS, для манипулирования и выполнения операций с данными.

Программы для Windows, мобильные приложения, игры - ВСЁ БЕСПЛАТНО, в нашем закрытом телеграмм канале - Подписывайтесь:)

Похожие записи

Добавить комментарий

Ваш адрес email не будет опубликован. Обязательные поля помечены *