Наборы данных SAS с примерами
SAS (программное обеспечение для статистического анализа) — это популярное программное обеспечение для анализа данных, которое может манипулировать, анализировать, организовывать и извлекать данные из различных источников, а также выполнять статистический анализ. Бизнес-моделирование, статистический анализ, управление данными, написание отчетов, хранение данных и разработка приложений — вот некоторые из других приложений.
Для нетехнических пользователей он имеет графический пользовательский интерфейс «укажи и щелкни», а также более сложные варианты выбора с помощью языка SAS. Это полезный инструмент, позволяющий применять качественные подходы и процедуры для повышения производительности персонала и прибыли компании.
SAS извлекает и классифицирует данные по таблицам, что позволяет выявлять и анализировать тенденции данных. Этот пакет программного обеспечения позволяет вам управлять сложным анализом, прогнозным анализом, бизнес-аналитикой и данными для эффективной работы в конкурентной и меняющейся корпоративной среде. SAS также не зависит от платформы, что означает, что он может работать в любой операционной системе, включая Linux, Windows, Mac, Ubuntu и другие.
В этой статье мы подробно обсудим встроенные и специальные наборы данных SAS в SAS.
Программы для Windows, мобильные приложения, игры - ВСЁ БЕСПЛАТНО, в нашем закрытом телеграмм канале - Подписывайтесь:)
Что такое набор данных SAS?
Набор данных состоит из переменных вместе с их значениями, которые часто называют значениями данных или наблюдениями. Внутри таблицы набор данных содержит и упорядочивает значения данных в виде строк и столбцов. Строки в SAS называются наблюдениями, а столбцы — переменными SAS.
Набор данных состоит из переменных и их значений, которые часто называют значениями данных или наблюдениями. Внутри таблицы набор данных содержит и упорядочивает значения данных в виде столбцов и строк. Столбцы известны как переменные SAS, а строки — как наблюдения в SAS.
Переменная (или столбец)
В представлении таблицы SAS каждый столбец обозначает переменную. Столбцы или переменные в приведенной выше области изображения — это продукт, размер города, население и тип масштаба.
Строки (или наблюдение)
В табличном представлении набора данных SAS каждая строка демонстрирует наблюдение.
Читайте также: Заработная плата SAS по всему миру
Части набора данных SAS
Части набора данных SAS включают следующее:
- Встроенные наборы данных
- Дескрипторная часть
- Специальные наборы данных SAS
- Часть данных
Давайте теперь посмотрим на них подробно.
Встроенные наборы данных SAS
В программном обеспечении SAS в библиотеке SAS уже есть несколько наборов данных, которые можно использовать для выполнения, анализа и создания примеров программ. Все наборы данных сохраняются в SASHELP в моих библиотеках.
Теперь, когда мы хотим использовать набор данных CARS, дважды щелкните его, чтобы открыть панель в правой части окна SAS. Набор данных CARS, который имеет встроенный набор данных в библиотеке SAS, показан ниже.
Часть дескриптора SAS
Раздел дескриптора набора данных содержит важную информацию, такую как время и дата самых последних наблюдений, количество наблюдений, переменных и модификаций в наборе данных и многое другое. Рассмотрим таблицу ниже, которая является примером дескриптора work.grad из набора данных SAS.
Специальные наборы данных SAS
Процессы SAS предоставляют настроенные наборы данных, которые обычно могут использоваться другими процедурами без прямых манипуляций.
Существует два типа специальных наборов данных SAS:
- Наборы данных по умолчанию
- НУЛЕВЫЕ наборы данных
Наборы данных по умолчанию
SAS может вызвать предыдущий набор данных, используя зарезервированное слово _LAST_. Если вы не объявите набор данных перед выполнением шага DATA или PROC, SAS будет использовать последний запущенный вами набор данных. Это известно как наборы данных по умолчанию.
Синтаксис
ДАННЫЕ_;
НУЛЕВЫЕ наборы данных
В других обстоятельствах мы можем захотеть выполнить шаг данных, но не создавать никаких наборов данных. В таких ситуациях мы можем использовать _NULL_. Следующий оператор создает шаг данных без создания каких-либо наборов данных.
Синтаксис
ДАННЫЕ _null_;
Часть данных
Часть данных состоит из значений данных набора данных SAS. Значения данных организованы в виде таблицы. Значения наблюдения данных переменных находятся в строке, а данные переменные находятся в столбце. Иллюстрация показана ниже:
Допустим, есть набор данных студентов.
Студент ДАТА;
Набор данных SAS содержит четыре переменные (номер рулона, имя, класс и высота), каждая из которых содержит четыре числа значений наблюдений, например значения номера рулона 101, 102, 103 и 104; Значения имен Субхаш, Намрита, Прити и Сушма; Значения класса 12, 10, 12 и 10; Значения высоты 155, 154, 156 и 153. Набор данных представляет собой целую таблицу, а значения данных представляют собой объединение наблюдений и переменных. В данных SAS можно хранить любое количество наблюдений и переменных.
Импорт внешних наборов данных
Есть два метода, с помощью которых мы можем импортировать внешние данные в SAS:
- ПРОЦ-импорт
- Получить внешний файл с помощью INFILE
ПРОЦ-импорт
Метод PROC в SAS автоматизирует процесс импорта внешнего набора данных. При импорте внешнего файла этим методом нам не нужно указывать длину и тип переменной. Этот метод поддерживает различные форматы, такие как txt, csv, excel и т. д.
Импорт файла, содержащего несколько разделителей
При использовании двух или более разделителей, таких как запятые и табуляции, ставьте их в кавычки после разделителя = опция.
Пример
PROC IMPORT DATAFILE = “C:\Simplilearn\sample.txt”
ВЫХОД = устаревшие данные
СУБД=dlm
ЗАМЕНЯТЬ;
разделитель =','09'x';
GETNAMES=ДА;
БЕГАТЬ;
Импорт файла, разделенного запятыми, с расширением CSV
Укажите DBMS= CSV, чтобы получить файл, разделенный запятыми, в SAS.
Пример
PROC IMPORT DATAFILE = “C:\Simplilearn\sample.txt”
ВЫХОД = устаревшие данные
СУБД=csv
ЗАМЕНЯТЬ;
GETNAMES=ДА;
БЕГАТЬ;
Импорт файла, разделенного табуляцией, в SAS
Код для импорта файла Excel идентичен коду ниже. Разница в том, что разделитель = '09'x и СУБД = DLM.
Пример
PROC IMPORT DATAFILE = “C:\Simplilearn\sample.txt”
ВЫХОД = устаревшие данные
СУБД=dlm
ЗАМЕНЯТЬ;
разделитель = '09'x;
GETNAMES=ДА;
БЕГАТЬ;
Импорт файла, разделенного запятыми, с расширением TXT
Укажите разделитель = ',', чтобы получить расширение txt, содержащее файл, разделенный запятыми, в SAS.
Пример
PROC IMPORT DATAFILE = “C:\Simplilearn\sample.txt”
ВЫХОД = устаревшие данные
СУБД=dlm
ЗАМЕНЯТЬ;
разделитель = ',';
GETNAMES=ДА;
БЕГАТЬ;
Импорт файла, разделенного пробелами
Если вы хотите извлечь файл с разделителем-пробелом, используйте разделитель = '20'x.
Пример
PROC IMPORT DATAFILE = “C:\Simplilearn\sample.txt”
ВЫХОД = устаревшие данные
СУБД=dlm
ЗАМЕНЯТЬ;
разделитель = '20'x;
GETNAMES=ДА;
БЕГАТЬ;
Импорт файла Excel в SAS
Важные ключевые слова, используемые в программе, приведены ниже:
- GETNAMES — используется для включения первой строки имен переменных данных.
- REPLACE — используется для перезаписи уже существующего набора данных SAS.
- OUT — используется для указания имени набора данных, созданного SAS. Outdata — это набор данных, который сохраняется в рабочей библиотеке приложения ниже (временная библиотека).
- ЛИСТ — импортирует один лист из книги Excel.
- СУБД — используется для указания типа данных для импорта.
Пример
PROC IMPORT DATAFILE=”c:\Simplilearn\sample.xls”
ВЫХОД = устаревшие данные
СУБД=xls
ЗАМЕНЯТЬ;
ЛИСТ=”Лист1″;
GETNAMES=ДА;
БЕГАТЬ;
Использование INFILE — получение внешнего файла
Используя метод INFILE, мы можем вручную импортировать внешние файлы в SAS. При этом нам нужно указать длину и типы переменной.
Импорт файла с разделителями TAB
Чтобы сообщить SAS, что импортируется файл с разделителями табуляции, мы можем использовать DLM='09'x. Даже если значение короче, чем ожидает оператор INPUT, оператор TRUNCOVER дает указание SAS присвоить переменной значение необработанных данных.
Пример
данные устарели;
infile 'C:\Simplilearn\sample.txt' DSD dlm='09'x truncover;
входной сотрудник: 30$. МЮ :mmddyy8. штат: 20$.;
бегать;
Импорт файла CSV
Следующие ключевые слова учитываются при импорте файла CSV с использованием INFILE:
Оператор INFILE — используется для указания местоположения файла данных.
DSD — изменить разделитель по умолчанию с пробела на запятую.
FIRSTOBS=2: это сообщает SAS, что вторая строка содержит значения данных, а первая строка содержит имена переменных.
Пример
данные устарели;
infile 'C:\Users\Simplilearn\documents\book1.csv' dsd firstobs=2;
входной идентификатор возраст пол $ dept $;
бегать;
- Петли SAS
- Руководство по макросам SAS
- SAS-массивы
- Линейная регрессия SAS
- Гистограмма САС
Выберите правильную программу
Вы с нетерпением ждете науки о данных? Наши курсы по науке о данных созданы для того, чтобы дать вам необходимые навыки и знания для достижения успеха в этой быстро развивающейся области. Чтобы помочь вам лучше понять, мы предоставили подробное сравнение.
Название программы | Магистерская программа Data Scientist | Последипломная программа в области науки о данных | Последипломная программа в области науки о данных |
Гео | Все регионы | Все регионы | Не применимо в США |
Университет | Простое обучение | Пердью | Калтех |
Продолжительность курса | 11 месяцев | 11 месяцев | 11 месяцев |
Требуется опыт кодирования | Базовый | Базовый | Нет |
Навыки, которые вы изучите | Более 10 навыков, включая структуру данных, манипулирование данными, NumPy, Scikit-Learn, Tableau и многое другое. | 8+ навыков, включая Исследовательский анализ данных, описательная статистика, логическая статистика и многое другое. | 8+ навыков, включая Контролируемое и неконтролируемое обучение Глубокое обучение Визуализация данных и многое другое. |
Дополнительные преимущества | Прикладное обучение через Capstone и более 25 проектов по науке о данных | Членство в Ассоциации выпускников Purdue Бесплатное членство IIMJobs Pro на 6 месяцев Возобновить помощь в построении | До 14 кредитов CEU Членство в кружке Caltech CTME |
Расходы | $$ | $$$$ | $$$$ |
Изучите программу | Изучите программу | Изучите программу |
Освойте SAS с помощью Simplilearn
SAS — довольно популярное программное обеспечение для анализа данных, которое аналитики данных и специалисты по данным используют для анализа данных путем манипулирования таблицами базы данных и выполнения различных операций с данными. Наборы данных SAS используются в этих операциях и состоят из следующих частей:
- Наборы данных по умолчанию
- Встроенные наборы данных
- Специальные наборы данных
- Дескрипторная часть
- Часть данных
В этой статье мы обсудили, что такое наборы данных SAS, и кратко описали различные части наборов данных SAS. Чтобы получить более глубокие знания в этой области, а также понять и изучить полные концепции, связанные с наукой о данных, с нуля, Simplilearn предлагает комплексную сертификацию по науке о данных для энтузиастов, которые хотят построить карьеру в области науки о данных и иметь возможность использовать замечательные программные системы, такие как как SAS для манипулирования данными и выполнения операций с ними.
Программы для Windows, мобильные приложения, игры - ВСЁ БЕСПЛАТНО, в нашем закрытом телеграмм канале - Подписывайтесь:)