Массивы SAS: полное руководство (с примерами)
SAS — это программный инструмент для визуализации и статистического анализа данных, управляемый командами. Он считается одним из наиболее часто используемых статистических программных инструментов как в научных кругах, так и в промышленности. Некоторые из его приложений включают разработку приложений, написание отчетов, управление данными и хранение данных. Он не зависит от платформы и может работать практически на любой операционной системе, такой как Ubuntu, Mac, Windows, Linux и т. д.
В этой статье мы узнаем, как используются массивы SAS для выполнения различных операций, связанных с программированием. Для начала разберемся, что такое массивы SAS.
Станьте экспертом по науке о данных и получите работу своей мечты. Программа последипломного образования Калифорнийского технологического института по программе Data ScienceExplore.
Что такое массивы SAS?
В SAS массивы используются для получения и хранения набора значений на основе значения индекса. Индекс обозначает зарезервированное место для хранения конкретного значения в ячейке. На этапе SAS DATA массивы предоставляют приемлемый и простой метод обработки набора переменных.
Программы для Windows, мобильные приложения, игры - ВСЁ БЕСПЛАТНО, в нашем закрытом телеграмм канале - Подписывайтесь:)
Далее давайте посмотрим на синтаксис, используемый этими массивами SAS.
Синтаксис массивов SAS
Для реализации массивов SAS используется следующий синтаксис:
МАССИВ (индекс) ($)
Параметры
- МАССИВ — используется для объявления массива.
- имя массива — произвольное имя массива, определяемое пользователем.
- индекс — количество значений, которые пользователь хочет сохранить в массиве.
- ($) — необязательный параметр, который используется для указания того, что тип значений, хранящихся в массиве, является символьным.
- список переменных — необязательный параметр, который используется в качестве заполнителя для необходимых значений, которые должны храниться в массиве.
- значения массива — фактические значения данных, которые должны быть сохранены в массиве. Они могут быть либо прочитаны из файла или строки данных, либо определены пользователем.
Теперь давайте рассмотрим несколько примеров массивов SAS.
Примеры объявления массива
Некоторые примеры объявления массива приведены ниже:
- МАССИВ НЕКОТОРОЕ_ИМЯ(7) (10 4 3 78 13); — Массив длиной 7 с именем «SOME_NAME», в котором хранятся значения — {10,4,3,78,13}
- МАССИВ ИМЯ2
- деги; – Там написано, что размер является динамическим и рассчитывается автоматически по количеству сохраненных значений.
- ИМЯ МАССИВ3(1:7) $ N1-N7; – Здесь объявляется массив с именем «NAME3», длина которого равна 7, и содержит переменные N1-N7 типа «символ».
МАССИВ ГОРОДА(0:7) ЧЕЙКУВД; – Массив имен CITIES, начинающийся с индекса 0 и имеющий длину массива 8.
Мы узнали, как объявлять массивы в SAS. Давайте теперь посмотрим, как мы можем получить доступ к этим значениям массива.
Станьте экспертом по науке о данных и получите работу своей мечты
Доступ к значениям массива
Для доступа к переменным и их значениям, хранящимся в массиве в SAS, мы использовали процедуру print. После объявления массива с помощью оператора DATALINES мы передаем данные.
Рассмотрим следующий пример –
Массив ДАННЫХ1;
ВВОД $a1 $a2 $a3 $a4 $a5 $;
МАССИВ цветов(5) $ a1-a5;
mix = a1||'+'||a2;
ДАННЫЕ;
желтый розовый оранжевый зеленый синий;
БЕГАТЬ;
ПРОЦ ПЕЧАТЬ ДАННЫХ = массив1;
БЕГАТЬ;
SAS_Arrays_1
Примеры программирования
Пример 1. Присвоение начальных значений массиву SAS
данные data_bin;
установить х;
массив тваров
_числовой_;
массив lvars
ты1 ты2 ты3;
массив kctinc {3} _temporary_ (1.1, 1.2, 1.3); делаю я = 1 до dim(tvars);
lvars{i} = tvars{i} * kctinc{i};
конец;
- брось я;
- бегать;
Ключевые слова
В приведенном выше примере мы умножаем значения переменных на различные числа.
В инструкции ARRAY при использовании ключевого слова _TEMPORARY_ элементы данных не сохраняются в файле данных, а создаются.
Пример 2. Замените числовые переменные, имеющие более трех значений, на пропущенное значение.
данные data_bin;
установить х;
массив тваров
_числовой_;
делаю я = 1 до dim(tvars);
если tvars{i} > 3, то tvars{i} =.;
- конец;
- брось я;
бегать;
Ключевые слова
«_numeric_» используется при указании всех числовых переменных.
Чтобы вернуть количество переменных и элементов, мы используем функцию DIM.
Пример 3. Заполнение новых символьных переменных после извлечения первой буквы.
данные data_bin;
установить х;
массив тваров
_характер_;
массив кваров
$х6 Х7;
- делаю я = 1 до dim(tvars);
kvars{i} = substr(kvars{i},1,1) ;
конец;
брось я;
бегать;
Ключевые слова
«_character_» используется при указании всех символьных переменных.
Пример 4. Для расчета процента роста.
данные data_bin;
установить х;
массив тваров
_числовой_;
массив y{2} _temporary_;
массив г{2};
- делаю я = от 1 до 2;
y{i} = tvars{i +1} – tvars{i};
g{i} = y{i} / tvars{i} ;
конец;
брось я;
Бегать;
Ключевые слова
«_numeric_» используется при указании всех числовых переменных.
Использование оператора OF
При анализе данных из массива реализуется оператор OF для выполнения вычислений над всей строкой массива. В приведенном ниже примере мы используем значения среднего и суммы в каждой строке.
Массив ДАННЫХ1;
ВХОД А1 А2 А3 А4;
МАССИВ А(4) А1-А4;
A_SUM = СУММА(A
);
A_MEAN = СРЕДНЕЕ(A
);
);
21 4 52 11
96 25 42 6
;
БЕГАТЬ;
ПРОЦ ПЕЧАТЬ ДАННЫХ = массив1;
БЕГАТЬ;
Результат выполнения приведенного выше кода обобщен ниже:
SAS_Arrays_2
Овладейте наукой о данных и разблокируйте роли высшего уровня с помощью магистерской программы Data ScientistНачните обучение
Овладейте наукой о данных и разблокируйте роли высшего уровня
Использование оператора IN
Оператор IN проверяет, присутствует ли значение в строке массива, а также используется при получении значения массива. Значения здесь чувствительны к регистру. Мы используем приведенный ниже пример, чтобы выполнить то же самое:
- ВХОД A1 $A2 $A3 $A4$;
- ЦВЕТА МАССИВА(4) A1-A4;
- ЕСЛИ «желтый» В ЦВЕТАХ, ТО доступен = «Да»; ИЛИ доступен = «Нет»;
- ДАННЫЕ;
- Оранжевый розовый фиолетово-желтый;
БЕГАТЬ;
ПРОЦ ПЕЧАТЬ ДАННЫХ = массив1;
БЕГАТЬ;
Ниже приведен вывод приведенного выше кода:
SAS_Arrays_3Наборы данных SASПетли SASРуководство по макросам SASЛинейная регрессия SASГистограмма САСИзучите науку о данных сегодняМассивы SAS используются для хранения значений в наборе переменных. Быстрый и простой подход к определению набора переменных для обработки на этапе данных. Теперь мы можем выполнить идентичные действия для последовательности связанных переменных, элементов массива, как только массив будет определен.Массивы SAS следуют определенному синтаксису и могут получать доступ к значениям массива с помощью процедуры печати и DATALINES для предоставления данных для выполнения различных операций. Некоторые из операторов, которые используются для выполнения операций с этими массивами, включают OF и IN.SAS — один из наиболее широко используемых пакетов программного обеспечения как в академических, так и в промышленных целях. Чтобы получить знания об этой технологии, лучше пройти тщательный углубленный курс. Simplilearn предлагает сертификацию по науке о данных, которая предоставляет комплексный сертифицированный учебный курс по науке о данных, который поможет вам изучить различные темы, связанные с наукой о данных (включая SAS), чтобы стать профессионалом в области данных и проложить свой будущий путь к данным в качестве специалиста по данным и связанной с ним карьеры.
Программы для Windows, мобильные приложения, игры - ВСЁ БЕСПЛАТНО, в нашем закрытом телеграмм канале - Подписывайтесь:)