Шпаргалка по R: Руководство по глоссарию R

R — один из наиболее часто используемых языков программирования в области машинного обучения и науки о данных, который широко используется как в академических кругах, так и в различных отраслях. Многие специалисты по данным теперь используют R в качестве предпочтительной вычислительной среды, поскольку он прост в изучении, имеет открытый исходный код и способен обрабатывать статистические вычисления и сложные данные.

Хотите узнать R? В этой статье мы рассмотрим обзор R с помощью простой для понимания шпаргалки. Используйте ее как удобное руководство высокого уровня для немедленного начала работы с R.

Шпаргалка по языку R

Здесь мы рассмотрим различные сочетания клавиш и символы, связанные с R.

Базовый синтаксис

Оператор

Цель

<- или =

Программы для Windows, мобильные приложения, игры - ВСЁ БЕСПЛАТНО, в нашем закрытом телеграмм канале - Подписывайтесь:)

Назначение

#

Комментарий

/

Разделение

<<-

Глобальное задание

%%

Остаток

*

Скалярное умножение

%/%

Целочисленное деление

%*%

Умножение матриц

в(1)

Первый элемент вектора

Доступ к справке

Имя функции

Цель

помощь.старт()

открывает справку

класс(df_name)

Возвращает класс данного объекта

?tidyverse

Показывает документацию пакета tidyverse

стр(df_name)

Возвращает информацию и структуру указанного объекта

?имя_функции

Показывает документацию встроенных функций

??”некоторые_вводные данные”

Показывает документацию по заданному входу

Кадр данных

Метод/Определение

Описание

резюме(df_name)

Возвращает статистику данных в описательном формате.

вид(df_name)

Открывает редактор

df_name = data.frame(studentID=1:5, year=c(“1960″,”1980″,”1990″,”1998″,”2001”),score=c(6,1,3,2,2))

Определение датафрейма

Утилита

Метод

Цель

заказ(индекс)

Чтобы найти индекс для сортировки вектора

применить(данные, ось, имя_функции)

Для применения данных к функции на определенной оси

данные = чтение.csv(файл.выбрать())

Для чтения данных из файлового проводника

dim()

Чтобы найти размеры матрицы/фрейма данных/вектора

lapply(данные, имя_функции)

Чтобы применить данные к функции

получить()

Получает рабочий каталог

длина()

Чтобы найти длину вектора

install.packages(“имя_пакета”)

Устанавливает требуемый пакет R

имена()

Возвращает имена столбцов

setwd(“C:/файл/путь”)

Чтобы установить текущий рабочий каталог

rapply(данные, имя_функции, как)

В зависимости от значения того, как, данные применяются к функции

сортировать()

Чтобы отсортировать вектор

rm(имя_переменной)

Чтобы удалить переменную

отсоединить(“имя пакета”)

Отсоединяет данный пакет

лс()

Чтобы перечислить все переменные

библиотека(“имя пакета”)

Делает содержимое указанного пакета готовым к использованию.

Вектор

Метод

Цель

убрать (с)

Чтобы найти диапазон вектора

число = с(3,7,2,1,8,5)

Определение числового вектора

повтор(1:8, раз=2)

Повторяет элементы вектора заданное количество раз.

сд (вещь)

Чтобы найти стандартное отклонение вектора

chr = c(“rte”,”qhz”)

Определение вектора символов

есть (век)

Чтобы найти дисперсию вектора

log = c(ЛОЖЬ, ЛОЖЬ, ИСТИНА)

Логический вектор

which.max(vec)

Чтобы найти положение максимального значения

which.min(vec)

Чтобы найти положение минимального значения

среднее(vec)

Чтобы найти среднее значение вектора

Матрицы и массивы

Метод

Цель

rbind(матрица1,матрица2)

Для привязки строк matrix1 и matrix2

cbind(матрица1,матрица2)

Для связывания столбцов matrix1 и matrix2

мат = матрица(1:15, nrow=3, ncol=5)

Чтобы определить матрицу

1D = массив(1:14)

Чтобы определить одномерный массив

2D = массив(1:20, размерность = c(1,3))

Чтобы определить двумерный массив

3D = массив(1:20, размерность = c(1,4,5))

Чтобы определить трехмерный массив

Гипотеза

Метод

Цель

аов()

Чтобы найти ANOVA или дисперсионный анализ

wilcox.test(данные)

Найти тест Уилкокса по заданным данным

t.тест(данные)

Чтобы найти 1 выборочный t-тест для заданных данных

кор.тест(данные1,данные2)

Чтобы найти корреляционный тест для данных данных

t.тест(данные1,данные2)

Чтобы найти 2-выборочный t-тест для заданных данных

chisq.тест(данные)

Чтобы найти критерий хи-квадрат для заданных данных

t.test(пред, после, парный=ИСТИНА)

Чтобы найти парный выборочный t-критерий для заданных данных

shapiro.тест(данные)

Найти тест Шапиро для заданных данных

Статистика и описательная статистика

Метод

Цель

colSums(данные())

Чтобы найти сумму столбца определенного столбца заданных данных

rowSums(данные())

Чтобы найти сумму строк определенной строки заданных данных

резюме(lm(y ~ x1 + x2 + x3, данные=моиданные))

Чтобы найти множественную регрессию заданных данных

кластер = kmeans(данные)

Чтобы найти кластерный анализ kmeans для заданных данных

резюме(glm(y ~ x1 + x2 + x3, family=””, data=mydata))

Чтобы найти классификацию заданных данных

colMeans(данные())

Чтобы найти среднее значение определенного столбца заданных данных

rowMeans(данные())

Чтобы найти среднее значение определенной строки заданных данных

Визуализация

Метод

Цель

geom_hist()

Чтобы найти гистограмму заданных данных

coord_flip()

Чтобы поменять местами координаты x и y заданной точки

ggplot(данные = NULL, отображение = aes(), …)

Инициализация объекта ggplot заданных данных

geom_density()

Для создания графика плотности заданных данных

facet_grid()

Разместить панели в сетке заданных данных

geom_point()

Для создания диаграмм рассеяния заданных данных

qplot(данные, строка=ИСТИНА,…)

Для создания квантильного графика заданных данных

geom_bar()

Для создания столбчатой ​​диаграммы заданных данных

Струны

Метод

Цель

вставить (…, sep = ” “, collapse = NULL)

Объединить векторы после преобразования в символ

tolower()

Преобразует заданный текст в строчные символы.

toupper()

Преобразует заданный текст в символы верхнего регистра.

toString(x)

Вспомогательная функция для создания строки из одного символа

подстрока(chr, n, n)

Чтобы заменить или извлечь подстроку заданной строки

Вероятность

Метод

Цель

рэксп(н)

Чтобы найти экспоненциальное распределение n

runif(n, мин = 0, макс = 1)

Чтобы найти равномерное распределение n

rbinom(n, размер, вероятность)

Чтобы найти биномиальное распределение n

rnorm(n, среднее, sd)

Чтобы найти нормальное распределение n

rpois(n, размер)

Чтобы найти распределение Пуассона n

Петли

Заявление

Цель

если(условие){ блок операторов } иначе { блок операторов }

формат операторов if-else

while(условие){ блок операторов }

формат цикла while

for(переменная в последовательности){ блок операторов }

для формата цикла

Изучите исследование данных, визуализацию данных, предиктивный анализ, пакеты R, структуры данных в R с сертификацией Data Science with R. Ознакомьтесь с курсом прямо сейчас!

Хотите узнать больше?

В этой статье мы рассмотрели все основы R со всеми необходимыми сокращениями. Чтобы узнать больше о R и стать экспертом в области машинного обучения, ознакомьтесь с курсом сертификации по Data Science with R от Simplilearn!

Программы для Windows, мобильные приложения, игры - ВСЁ БЕСПЛАТНО, в нашем закрытом телеграмм канале - Подписывайтесь:)

Похожие записи

Добавить комментарий

Ваш адрес email не будет опубликован. Обязательные поля помечены *