Шпаргалка по R: Руководство по глоссарию R
R — один из наиболее часто используемых языков программирования в области машинного обучения и науки о данных, который широко используется как в академических кругах, так и в различных отраслях. Многие специалисты по данным теперь используют R в качестве предпочтительной вычислительной среды, поскольку он прост в изучении, имеет открытый исходный код и способен обрабатывать статистические вычисления и сложные данные.
Хотите узнать R? В этой статье мы рассмотрим обзор R с помощью простой для понимания шпаргалки. Используйте ее как удобное руководство высокого уровня для немедленного начала работы с R.
Шпаргалка по языку R
Здесь мы рассмотрим различные сочетания клавиш и символы, связанные с R.
Базовый синтаксис
Оператор | Цель |
<- или = Программы для Windows, мобильные приложения, игры - ВСЁ БЕСПЛАТНО, в нашем закрытом телеграмм канале - Подписывайтесь:) | Назначение |
# | Комментарий |
/ | Разделение |
<<- | Глобальное задание |
%% | Остаток |
* | Скалярное умножение |
%/% | Целочисленное деление |
%*% | Умножение матриц |
в(1) | Первый элемент вектора |
Доступ к справке
Имя функции | Цель |
помощь.старт() | открывает справку |
класс(df_name) | Возвращает класс данного объекта |
?tidyverse | Показывает документацию пакета tidyverse |
стр(df_name) | Возвращает информацию и структуру указанного объекта |
?имя_функции | Показывает документацию встроенных функций |
??”некоторые_вводные данные” | Показывает документацию по заданному входу |
Кадр данных
Метод/Определение | Описание |
резюме(df_name) | Возвращает статистику данных в описательном формате. |
вид(df_name) | Открывает редактор |
df_name = data.frame(studentID=1:5, year=c(“1960″,”1980″,”1990″,”1998″,”2001”),score=c(6,1,3,2,2)) | Определение датафрейма |
Утилита
Метод | Цель |
заказ(индекс) | Чтобы найти индекс для сортировки вектора |
применить(данные, ось, имя_функции) | Для применения данных к функции на определенной оси |
данные = чтение.csv(файл.выбрать()) | Для чтения данных из файлового проводника |
dim() | Чтобы найти размеры матрицы/фрейма данных/вектора |
lapply(данные, имя_функции) | Чтобы применить данные к функции |
получить() | Получает рабочий каталог |
длина() | Чтобы найти длину вектора |
install.packages(“имя_пакета”) | Устанавливает требуемый пакет R |
имена() | Возвращает имена столбцов |
setwd(“C:/файл/путь”) | Чтобы установить текущий рабочий каталог |
rapply(данные, имя_функции, как) | В зависимости от значения того, как, данные применяются к функции |
сортировать() | Чтобы отсортировать вектор |
rm(имя_переменной) | Чтобы удалить переменную |
отсоединить(“имя пакета”) | Отсоединяет данный пакет |
лс() | Чтобы перечислить все переменные |
библиотека(“имя пакета”) | Делает содержимое указанного пакета готовым к использованию. |
Вектор
Метод | Цель |
убрать (с) | Чтобы найти диапазон вектора |
число = с(3,7,2,1,8,5) | Определение числового вектора |
повтор(1:8, раз=2) | Повторяет элементы вектора заданное количество раз. |
сд (вещь) | Чтобы найти стандартное отклонение вектора |
chr = c(“rte”,”qhz”) | Определение вектора символов |
есть (век) | Чтобы найти дисперсию вектора |
log = c(ЛОЖЬ, ЛОЖЬ, ИСТИНА) | Логический вектор |
which.max(vec) | Чтобы найти положение максимального значения |
which.min(vec) | Чтобы найти положение минимального значения |
среднее(vec) | Чтобы найти среднее значение вектора |
Матрицы и массивы
Метод | Цель |
rbind(матрица1,матрица2) | Для привязки строк matrix1 и matrix2 |
cbind(матрица1,матрица2) | Для связывания столбцов matrix1 и matrix2 |
мат = матрица(1:15, nrow=3, ncol=5) | Чтобы определить матрицу |
1D = массив(1:14) | Чтобы определить одномерный массив |
2D = массив(1:20, размерность = c(1,3)) | Чтобы определить двумерный массив |
3D = массив(1:20, размерность = c(1,4,5)) | Чтобы определить трехмерный массив |
Гипотеза
Метод | Цель |
аов() | Чтобы найти ANOVA или дисперсионный анализ |
wilcox.test(данные) | Найти тест Уилкокса по заданным данным |
t.тест(данные) | Чтобы найти 1 выборочный t-тест для заданных данных |
кор.тест(данные1,данные2) | Чтобы найти корреляционный тест для данных данных |
t.тест(данные1,данные2) | Чтобы найти 2-выборочный t-тест для заданных данных |
chisq.тест(данные) | Чтобы найти критерий хи-квадрат для заданных данных |
t.test(пред, после, парный=ИСТИНА) | Чтобы найти парный выборочный t-критерий для заданных данных |
shapiro.тест(данные) | Найти тест Шапиро для заданных данных |
Статистика и описательная статистика
Метод | Цель |
colSums(данные()) | Чтобы найти сумму столбца определенного столбца заданных данных |
rowSums(данные()) | Чтобы найти сумму строк определенной строки заданных данных |
резюме(lm(y ~ x1 + x2 + x3, данные=моиданные)) | Чтобы найти множественную регрессию заданных данных |
кластер = kmeans(данные) | Чтобы найти кластерный анализ kmeans для заданных данных |
резюме(glm(y ~ x1 + x2 + x3, family=””, data=mydata)) | Чтобы найти классификацию заданных данных |
colMeans(данные()) | Чтобы найти среднее значение определенного столбца заданных данных |
rowMeans(данные()) | Чтобы найти среднее значение определенной строки заданных данных |
Визуализация
Метод | Цель |
geom_hist() | Чтобы найти гистограмму заданных данных |
coord_flip() | Чтобы поменять местами координаты x и y заданной точки |
ggplot(данные = NULL, отображение = aes(), …) | Инициализация объекта ggplot заданных данных |
geom_density() | Для создания графика плотности заданных данных |
facet_grid() | Разместить панели в сетке заданных данных |
geom_point() | Для создания диаграмм рассеяния заданных данных |
qplot(данные, строка=ИСТИНА,…) | Для создания квантильного графика заданных данных |
geom_bar() | Для создания столбчатой диаграммы заданных данных |
Струны
Метод | Цель |
вставить (…, sep = ” “, collapse = NULL) | Объединить векторы после преобразования в символ |
tolower() | Преобразует заданный текст в строчные символы. |
toupper() | Преобразует заданный текст в символы верхнего регистра. |
toString(x) | Вспомогательная функция для создания строки из одного символа |
подстрока(chr, n, n) | Чтобы заменить или извлечь подстроку заданной строки |
Вероятность
Метод | Цель |
рэксп(н) | Чтобы найти экспоненциальное распределение n |
runif(n, мин = 0, макс = 1) | Чтобы найти равномерное распределение n |
rbinom(n, размер, вероятность) | Чтобы найти биномиальное распределение n |
rnorm(n, среднее, sd) | Чтобы найти нормальное распределение n |
rpois(n, размер) | Чтобы найти распределение Пуассона n |
Петли
Заявление | Цель |
если(условие){ блок операторов } иначе { блок операторов } | формат операторов if-else |
while(условие){ блок операторов } | формат цикла while |
for(переменная в последовательности){ блок операторов } | для формата цикла |
Изучите исследование данных, визуализацию данных, предиктивный анализ, пакеты R, структуры данных в R с сертификацией Data Science with R. Ознакомьтесь с курсом прямо сейчас!
Хотите узнать больше?
В этой статье мы рассмотрели все основы R со всеми необходимыми сокращениями. Чтобы узнать больше о R и стать экспертом в области машинного обучения, ознакомьтесь с курсом сертификации по Data Science with R от Simplilearn!
Программы для Windows, мобильные приложения, игры - ВСЁ БЕСПЛАТНО, в нашем закрытом телеграмм канале - Подписывайтесь:)