Наборы данных SAS с примерами
SAS (Statistical Analysis Software) — популярное программное обеспечение для анализа данных, которое может манипулировать, добывать, организовывать и извлекать данные из различных источников, а также выполнять статистический анализ. Бизнес-моделирование, статистический анализ, управление данными, написание отчетов, хранение данных и разработка приложений — вот некоторые из других приложений.
Для нетехнических пользователей он имеет графический пользовательский интерфейс point-and-click, а также более сложные варианты выбора через язык SAS. Это полезный инструмент, который позволяет применять качественные подходы и процедуры для повышения производительности персонала и корпоративной прибыли.
SAS извлекает и классифицирует данные в таблицы, позволяя вам обнаруживать и анализировать тенденции данных. Этот программный пакет позволяет вам управлять сложным анализом, предиктивным анализом, бизнес-аналитикой и данными для эффективной работы в конкурентной и меняющейся корпоративной среде. SAS также является платформенно-нейтральным, что означает, что он может работать на любой операционной системе, включая Linux, Windows, Mac, Ubuntu и другие.
В этой статье мы подробно обсудим встроенные и специальные наборы данных SAS.
Программы для Windows, мобильные приложения, игры - ВСЁ БЕСПЛАТНО, в нашем закрытом телеграмм канале - Подписывайтесь:)
Что такое набор данных SAS?
Набор данных состоит из переменных вместе с их значениями, которые часто называют значениями данных или наблюдениями. В таблице набор данных содержит и упорядочивает значения данных в виде строк и столбцов. Строки известны как наблюдения в SAS, а столбцы известны как переменные SAS.
Набор данных состоит из переменных и их значений, которые часто называют значениями данных или наблюдениями. В таблице набор данных содержит и упорядочивает значения данных в виде столбцов и строк. Столбцы называются переменными SAS, а строки называются наблюдениями в SAS.
Переменная (или столбец)
В представлении таблицы SAS каждый столбец обозначает переменную. Столбцы или переменные в области изображения выше — это продукт, размер города, население и тип масштаба.
Ряды (или наблюдение)
В табличном представлении набора данных SAS каждая строка отображает наблюдение.
Читайте также: Зарплата SAS по всему миру
Части набора данных SAS
Части набора данных SAS включают в себя следующее:
- Встроенные наборы данных
- Часть дескриптора
- Специальные наборы данных SAS
- Часть данных
Давайте теперь рассмотрим их подробнее.
Встроенные наборы данных SAS
В программном обеспечении SAS есть несколько наборов данных, которые уже находятся в библиотеке SAS, которые можно использовать для выполнения, анализа и генерации примеров программ. Все наборы данных сохранены в SASHELP в моих библиотеках.
Теперь, когда мы хотим использовать набор данных CARS, дважды щелкните по нему, чтобы открыть панель в правой части окна SAS. Набор данных CARS, имеющий встроенный набор данных в библиотеке SAS, показан ниже.
Часть дескриптора SAS
Раздел дескриптора набора данных содержит важную информацию, такую как время и дата последнего, количество наблюдений, переменных и изменений в наборе данных и многое другое. Рассмотрим таблицу ниже, которая является примером дескриптора work.grad из набора данных SAS.
Специальные наборы данных SAS
Процессы SAS предоставляют настраиваемые наборы данных, которые обычно могут использоваться другими процедурами без непосредственного манипулирования.
Существует два вида специальных наборов данных SAS:
- Наборы данных по умолчанию
- Наборы данных NULL
Наборы данных по умолчанию
SAS может вызвать предыдущий набор данных, используя зарезервированное слово _LAST_. Если вы не объявите набор данных перед запуском шага DATA или PROC, SAS будет использовать последний запущенный вами набор данных. Это известно как наборы данных по умолчанию.
Синтаксис
ДАННЫЕ_;
Наборы данных NULL
В других обстоятельствах мы можем захотеть запустить шаг данных, но не создавать никаких наборов данных. В таких ситуациях мы можем использовать _NULL_. Следующий оператор создает шаг данных, не создавая никаких наборов данных.
Синтаксис
ДАННЫЕ _null_;
Часть данных
Часть данных состоит из значений данных набора данных SAS. Значения данных организованы в табличном формате. Значения наблюдений заданных переменных находятся в строке, а заданные переменные — в столбце. Иллюстрация показана ниже:
Предположим, есть набор данных о студентах.
студент ДАННЫХ;
Набор данных SAS имеет четыре переменные (Roll Number, Name, Class и Height), каждая с четырьмя числами значений наблюдений, например, значения Roll Number 101, 102, 103 и 104; значения Name Subhash, Namrita, Preeti и Sushma; значения Class 12, 10, 12 и 10; значения Height 155, 154, 156 и 153. Набор данных представляет собой целую таблицу, а значения данных являются слиянием наблюдений и переменных. В данных SAS может храниться любое количество наблюдений и переменных.
Импорт внешних наборов данных
Существует два способа импорта внешних данных в SAS:
- PROC-импорт
- Получить внешний файл с помощью INFILE
PROC-импорт
Метод PROC в SAS автоматизирует процесс импорта внешнего набора данных. При импорте внешнего файла с помощью этого метода нам не нужно упоминать длину и тип переменной. Этот метод поддерживает различные форматы, такие как txt, csv, excel и т. д.
Импорт файла, содержащего несколько разделителей
При использовании двух или более разделителей, таких как запятые и табуляции, заключите их в кавычки после delimiter = option
Пример
PROC IMPORT DATAFILE= “C:\Simplilearn\sample.txt”
OUT= outdata
СУБД=dlm
ЗАМЕНЯТЬ;
разделитель=','09'x ';
GETNAMES=ДА;
БЕГАТЬ;
Импорт файла с разделителями-запятыми и расширением CSV
Укажите DBMS=CSV, чтобы получить файл с разделителями-запятыми в SAS.
Пример
PROC IMPORT DATAFILE= “C:\Simplilearn\sample.txt”
OUT= outdata
СУБД=csv
ЗАМЕНЯТЬ;
GETNAMES=ДА;
БЕГАТЬ;
Импорт файла с разделителями табуляции в SAS
Код для импорта файла Excel идентичен коду ниже. Разница в том, что разделитель = '09'x и СУБД = DLM.
Пример
PROC IMPORT DATAFILE= “C:\Simplilearn\sample.txt”
OUT= outdata
СУБД=dlm
ЗАМЕНЯТЬ;
разделитель='09'x;
GETNAMES=ДА;
БЕГАТЬ;
Импорт файла с разделителями-запятыми и расширением TXT
Укажите разделитель = ',', чтобы получить расширение txt, содержащее файл, разделенный запятыми, в SAS.
Пример
PROC IMPORT DATAFILE= “C:\Simplilearn\sample.txt”
OUT= outdata
СУБД=dlm
ЗАМЕНЯТЬ;
разделитель=',';
GETNAMES=ДА;
БЕГАТЬ;
Импорт файла, разделенного пробелами
Если вы хотите извлечь файл с разделителем-пробелом, используйте delimiter = '20'x.
Пример
PROC IMPORT DATAFILE= “C:\Simplilearn\sample.txt”
OUT= outdata
СУБД=dlm
ЗАМЕНЯТЬ;
разделитель='20'x;
GETNAMES=ДА;
БЕГАТЬ;
Импорт файла Excel в SAS
Ниже приведены важные ключевые слова, используемые в программе:
- GETNAMES — используется для включения первой строки имен переменных данных.
- REPLACE — используется для перезаписи уже существующего набора данных SAS.
- OUT – Используется для указания имени набора данных, созданного SAS. Outdata – это набор данных, который сохраняется в рабочей библиотеке в приложении ниже (временная библиотека)
- ЛИСТ — импортирует один лист из книги Excel.
- СУБД — используется для указания типа импортируемых данных.
Пример
PROC IMPORT DATAFILE= “c:\Simplilearn\sample.xls”
OUT= outdata
СУБД=xls
ЗАМЕНЯТЬ;
ЛИСТ=”Лист1″;
GETNAMES=ДА;
БЕГАТЬ;
Использование INFILE — получение внешнего файла
Используя метод INFILE, мы можем вручную импортировать внешние файлы на SAS. При этом нам нужно указать длину и типы переменной.
Импорт файла с разделителями TAB
Чтобы сообщить SAS, что импортируется файл с разделителями табуляции, мы можем использовать DLM='09'x. Даже если значение короче, чем ожидает оператор INPUT, оператор TRUNCOVER дает SAS указание присвоить переменной необработанное значение данных.
Пример
данные устарели;
входящий файл 'C:\Simplilearn\sample.txt' DSD dlm='09'x truncover;
ввод сотрудник: 30 долл. США. DOJ: ммддгг8. штат: 20 долл. США.;
бегать;
Импорт CSV-файла
При импорте CSV-файла с помощью INFILE учитываются следующие ключевые слова:
Оператор INFILE — используется для указания местоположения файла данных.
DSD — для изменения разделителя по умолчанию с пробела на запятую.
FIRSTOBS=2: это сообщает SAS, что вторая строка содержит значения данных, а первая строка содержит имена переменных.
Пример
данные устарели;
входящий файл 'C:\Users\Simplilearn\documents\book1.csv' dsd firstobs=2;
входной идентификатор возраст пол $ отдел $;
бегать;
- SAS-петли
- Руководство по макросам SAS
- SAS-массивы
- Линейная регрессия SAS
- Гистограмма SAS
Выберите правильную программу
Вы с нетерпением ждете науки о данных? Наши курсы по науке о данных специально разработаны, чтобы снабдить вас необходимыми навыками и знаниями для успеха в этой быстро развивающейся области. Чтобы помочь вам лучше понять, мы предоставили всестороннее сравнение.
Название программы | Магистерская программа «Специалист по данным» | Программа последипломного образования в области науки о данных | Программа последипломного образования в области науки о данных |
Гео | Все Гео | Все Гео | Не применимо в США. |
Университет | Simplelearn | Пердью | Калтех |
Продолжительность курса | 11 месяцев | 11 месяцев | 11 месяцев |
Требуется опыт кодирования | Базовый | Базовый | Нет |
Навыки, которые вы приобретете | Более 10 навыков, включая структуру данных, обработку данных, NumPy, Scikit-Learn, Tableau и многое другое | 8+ навыков, включая Исследовательский анализ данных, описательная статистика, выводная статистика и многое другое | 8+ навыков, включая Контролируемое и неконтролируемое обучение Глубокое обучение Визуализация данных и многое другое |
Дополнительные преимущества | Прикладное обучение через Capstone и более 25 проектов по науке о данных | Членство в Ассоциации выпускников Пердью Бесплатное членство IIMJobs Pro на 6 месяцев Помощь в составлении резюме | До 14 кредитов CEU Членство в кружке Caltech CTME |
Расходы | $$ | $$$$ | $$$$ |
Программа исследования | Программа исследования | Программа исследования |
Освойте SAS с Simplilearn
SAS — довольно популярное программное обеспечение для анализа данных, которое аналитики данных и специалисты по данным используют для анализа данных, манипулируя таблицами базы данных и выполняя различные операции с данными. Наборы данных SAS используются в этих операциях и состоят из следующих частей:
- Наборы данных по умолчанию
- Встроенные наборы данных
- Специальные наборы данных
- Часть дескриптора
- Часть данных
В этой статье мы обсудили, что именно представляют собой наборы данных SAS, и кратко описали различные части наборов данных SAS. Чтобы получить более глубокие знания относительно того же самого и понять и изучить полные концепции, связанные с наукой о данных с нуля, Simplilearn предлагает комплексную сертификацию по науке о данных для энтузиастов, которые хотят построить карьеру в науке о данных и уметь использовать замечательные программные системы, такие как SAS, для манипулирования и выполнения операций с данными.
Программы для Windows, мобильные приложения, игры - ВСЁ БЕСПЛАТНО, в нашем закрытом телеграмм канале - Подписывайтесь:)