Массивы SAS: полное руководство (с примерами)
SAS — это программный инструмент визуализации данных и статистического анализа, управляемый командами. Он считается одним из наиболее часто используемых статистических программных инструментов как в академических кругах, так и в промышленности. Некоторые из его приложений включают разработку приложений, написание отчетов, управление данными и хранение данных. Он не зависит от платформы и может работать практически на любой операционной системе, такой как Ubuntu, Mac, Windows, Linux и т. д.
В этой статье мы узнаем, как реализованы массивы SAS для выполнения различных операций, связанных с программированием. Для начала давайте разберемся, что такое массивы SAS.
Станьте экспертом в области науки о данных и получите работу своей мечтыПрограмма аспирантуры Калифорнийского технологического института по науке о данныхИзучить программу
Что такое массивы SAS?
В SAS массивы используются для извлечения и хранения набора значений на основе индексного значения. Индекс обозначает зарезервированное место для хранения конкретного значения в ячейке. В фазе SAS DATA массивы предоставляют приемлемый и простой метод обработки набора переменных.
Программы для Windows, мобильные приложения, игры - ВСЁ БЕСПЛАТНО, в нашем закрытом телеграмм канале - Подписывайтесь:)
Далее давайте рассмотрим синтаксис, используемый этими массивами SAS.
Синтаксис массивов SAS
Для реализации массивов SAS используется следующий синтаксис:
МАССИВ <ИМЯ-МАССИВА>(индекс) ($) <список-переменных-значений-массива>
Параметры
- ARRAY — используется для объявления массива.
- имя массива — пользовательское имя массива, определяемое пользователем.
- индекс — количество значений, которые пользователь хочет сохранить в массиве.
- ($) — необязательный параметр, который используется для указания того, что тип значений, хранящихся в массиве, — это символьные значения.
- list-of-variables — необязательный параметр, который используется в качестве заполнителя для требуемых значений, которые должны быть сохранены в массиве.
- значения-массива – фактические значения данных, которые должны быть сохранены в массиве. Они могут быть считаны из файла или строки данных или определены пользователем
Теперь давайте рассмотрим несколько примеров массивов SAS.
Примеры объявления массива
Некоторые примеры объявления массива приведены ниже:
- ARRAY SOME_NAME(7) (10 4 3 78 13); – Массив длиной 7 с именем «SOME_NAME», в котором хранятся значения – {10,4,3,78,13}
- ИМЯ МАССИВА2
- deghi; – Там написано, что размер динамический и рассчитывается автоматически по количеству сохраненных значений.
- ARRAY NAME3(1:7) $ N1-N7; – Здесь объявляется массив с именем «NAME3», длина которого равна 7 и который содержит переменные N1-N7, имеющие тип «character».
ARRAY CITIES(0:7) CHEIQUWD; – Массив имен CITIES, которые начинаются с индекса 0 и имеют длину массива 8.
Мы узнали, как объявлять массивы в SAS. Давайте теперь посмотрим, как мы можем получить доступ к этим значениям массива.
Станьте экспертом в области науки о данных и получите работу своей мечты
Доступ к значениям массива
Для доступа к переменным и их значениям, хранящимся в массиве в SAS, мы использовали процедуру print. После объявления массива, используя оператор DATALINES, мы предоставляем данные.
Рассмотрим следующий пример:
ДАННЫЕ массив1;
ВВОД $a1 $a2 $a3 $a4 $a5 $;
МАССИВ цветов(5) $ a1-a5;
смесь = а1||'+'||а2;
ЛИНИИ ДАННЫХ;
жёлтый розовый оранжевый зелёный синий;
БЕГАТЬ;
ПРОЦЕСС ПЕЧАТИ ДАННЫХ = массив1;
БЕГАТЬ;
SAS_Arrays_1
Примеры программирования
Пример 1. Присвоение начальных значений массиву SAS
данные data_bin;
установить х;
массив tvars
_числовой_;
массив lvars
ты1 ты2 ты3;
массив kctinc {3} _временный_ (1.1 , 1.2 ,1.3); сделать i = 1 для dim(tvars);
lvars{i} = tvars{i} * kctinc{i};
конец;
- капля i;
- бегать;
Ключевые слова
В приведенном выше примере мы умножаем значения переменных на различные числа.
В операторе ARRAY при использовании ключевого слова _TEMPORARY_ элементы данных не сохраняются в файле данных, а создаются.
Пример 2. Замена числовых переменных со значениями больше 3 отсутствующим значением.
данные data_bin;
установить х;
массив tvars
_числовой_;
сделать i = 1 для dim(tvars);
если tvars{i} > 3, то tvars{i} =.;
- конец;
- капля i;
бегать;
Ключевые слова
«_numeric_» используется для указания всех числовых переменных.
Чтобы вернуть количество переменных и элементов, мы используем функцию DIM.
Пример 3 — Заполнение новых символьных переменных после извлечения первой буквы.
данные data_bin;
установить х;
массив tvars
_характер_;
массив кварца
$ х6 х7;
- сделать i = 1 для dim(tvars);
kvars{i} = substr(tvars{i},1,1) ;
конец;
капля i;
бегать;
Ключевые слова
«_character_» используется для указания всех символьных переменных.
Пример 4 — Расчет процента роста.
данные data_bin;
установить х;
массив tvars
_числовой_;
массив y{2} _временный_;
массив g{2};
- сделать i = 1 к 2;
y{i} = tvars{i +1} – tvars{i};
g{i} = y{i} / tvars{i} ;
конец;
капля i;
Бегать;
Ключевые слова
«_numeric_» используется для указания всех числовых переменных.
Использование оператора OF
При анализе данных из массива оператор OF реализован для выполнения вычислений по всей строке массива. Мы используем значения Mean и Sum в каждой строке в примере ниже.
ДАННЫЕ массив1;
ВХОД А1 А2 А3 А4;
МАССИВ А(4) А1-А4;
A_SUM = СУММА(A
);
A_MEAN = СРЕДНЕЕ(ИЗ A
);
);
21 4 52 11
96 25 42 6
;
БЕГАТЬ;
ПРОЦЕСС ПЕЧАТИ ДАННЫХ = массив1;
БЕГАТЬ;
Результат выполнения приведенного выше кода представлен ниже:
SAS_Arrays_2
Станьте специалистом по обработке данных с реальным опытомПрограмма магистратуры по обработке данныхИзучить программу
Станьте специалистом по обработке данных с реальным опытом
Использование оператора IN
Оператор IN проверяет, присутствует ли значение в строке массива, а также используется для извлечения значения массива. Значения в нем чувствительны к регистру. Мы используем пример ниже, чтобы сделать то же самое:
- ВХОД A1 $ A2 $ A3 $ A4 $;
- МАССИВ ЦВЕТОВ (4) A1-A4;
- ЕСЛИ «жёлтый» В ЦВЕТАХ ТО доступно = «Да»; ИНАЧЕ доступно = «Нет»;
- ЛИНИИ ДАННЫХ;
- Оранжевый, розовый, фиолетовый, желтый;
БЕГАТЬ;
ПРОЦЕСС ПЕЧАТИ ДАННЫХ = массив1;
БЕГАТЬ;
Ниже приведен вывод для приведенного выше кода:
SAS_Arrays_3Наборы данных SASSAS-петлиРуководство по макросам SASЛинейная регрессия SASГистограмма SASИзучите науку о данных сегодняМассивы SAS используются для хранения значений в наборе переменных. Быстрый и простой подход к определению набора переменных для обработки в фазе данных. Теперь мы можем выполнять идентичные действия для последовательности связанных переменных, элементов массива, после того как массив был определен.Массивы SAS следуют определенному синтаксису и могут получать доступ к значениям массива с помощью процедуры печати и DATALINES для предоставления данных для выполнения различных операций. Некоторые из операторов, которые используются для выполнения операций с этими массивами, включают OF и IN.SAS — один из наиболее широко используемых пакетов программного обеспечения как в академическом, так и в промышленном плане. Чтобы получить знания об этой технологии, лучше рассмотреть основательный, углубленный курс. Simplilearn предлагает сертификацию по науке о данных, которая предоставляет комплексный сертифицированный учебный лагерь по науке о данных, помогая вам изучить различные темы, связанные с наукой о данных (включая SAS), чтобы стать профессионалом в области данных и проложить свой будущий путь в области данных в качестве специалиста по данным и смежных карьерах.
Программы для Windows, мобильные приложения, игры - ВСЁ БЕСПЛАТНО, в нашем закрытом телеграмм канале - Подписывайтесь:)