Получить количество столбцов в R DataFrame

Polucit Kolicestvo Stolbcov V R Dataframe



В R получение количества столбцов является базовой операцией, которая требуется во многих ситуациях при работе с DataFrames. При подгруппах, анализе, манипулировании, публикации и визуализации данных количество столбцов является важной частью информации, которую необходимо знать. Поэтому R предоставляет различные подходы для получения суммы столбцов указанного DataFrame. В этой статье мы обсудим некоторые подходы, которые помогают нам получить количество столбцов DataFrame.

Пример 1: Использование функции Ncol()

ncol() — наиболее часто используемая функция для получения суммы столбцов DataFrames.







df <- data.frame('y1' = c(10, 12, 14, 19),

«у2» = с(15, 22, 24, 29),
'у3' = с(25, 32, 34, 39))


n <- ncol(df)

cat('-----Количество столбцов во фрейме данных:', n)

В этом примере мы сначала создаем кадр данных «df» с тремя столбцами, помеченными как «y1», «y2» и «y3», с помощью функции data.frame() в R. Элементы в каждом столбце указываются с помощью функция c(), которая создает вектор элементов. Затем, используя переменную «n», функция ncol() используется для определения общего количества столбцов в кадре данных «df». Наконец, с описательным сообщением и переменной «n» предоставленная функция cat() выводит результаты на консоль.



Как и ожидалось, полученные выходные данные указывают на то, что указанный DataFrame имеет три столбца:







Пример 2: подсчитайте общее количество столбцов для пустого фрейма данных

Затем мы применяем функцию ncol() к пустому кадру данных, который также получает значения всех столбцов, но это значение равно нулю.

empty_df <- data.frame()

n <- ncol(empty_df)

cat('---Столбцы во фрейме данных:', n)

В этом примере мы генерируем пустой DataFrame, «empty_df», вызывая data.frame() без указания каких-либо столбцов или строк. Затем мы используем функцию ncol(), которая используется для определения количества столбцов в DataFrame. Функция ncol() устанавливается с DataFrame «empty_df» здесь, чтобы получить общее количество столбцов. Поскольку DataFrame «empty_df» пуст, в нем нет столбцов. Таким образом, вывод ncol(empty_df) равен 0. Результаты отображаются функцией cat(), которая развернута здесь.



Вывод показывает значение «0», как и ожидалось, потому что DataFrame пуст.

Пример 3: Использование функции Select_If() с функцией Length()

Если мы хотим получить количество столбцов любого определенного типа, мы должны использовать функцию select_if() в сочетании с функцией length() R. Эти функции используются, которые объединяются для получения общего количества столбцов каждого типа. . Код для использования этих функций реализован следующим образом:

библиотека (dplyr)

x1<-БУКВЫ[1:10]

x2<-rpois(10,2)

x3<-rpois(10,5)

x4<-sample(c('Лето','Зима'),10,replace=TRUE)

df1<-data.frame(x1,x2,x3,x4)

df1

длина (select_if (df1, is.numeric))

В этом примере мы сначала загружаем пакет dplyr, чтобы получить доступ к функциям select_if() и length(). Затем мы создаем четыре переменные — «x1», «x2», «x3» и «x4» соответственно. Здесь «x1» содержит первые 10 заглавных букв английского алфавита. Переменные «x2» и «x3» генерируются с помощью функции rpois() для создания двух отдельных векторов из 10 случайных чисел с параметрами 2 и 5 соответственно. Переменная «x4» представляет собой факторный вектор с 10 элементами, которые случайным образом выбираются из вектора c («Лето», «Зима»).

Затем мы пытаемся создать DataFrame «df1», в котором все переменные передаются в функцию data.frame(). Наконец, мы вызываем функцию length(), чтобы определить длину кадра данных «df1», созданного с помощью функции select_if() из пакета dplyr. Функция select_if() выбирает столбцы из DataFrame «df1» в качестве аргумента, а функция is.numeric() выбирает только столбцы, содержащие числовые значения. Затем функция length() получает общее количество столбцов, выбранных функцией select_if(), что является результатом всего кода.

Длина столбца показана в следующем выводе, который указывает общее количество столбцов DataFrame:

Пример 4: Использование функции Sapply()

И наоборот, если мы хотим подсчитать только пропущенные значения столбцов, у нас есть функция sapply(). Функция sapply() перебирает каждый столбец DataFrame для конкретной работы. Функция sapply() сначала передается с DataFrame в качестве аргумента. Затем требуется выполнить операцию над этим DataFrame. Реализация функции sapply() для получения количества значений NA в столбцах DataFrame обеспечивается следующим образом:

new_df <- data.frame(c1 = c(10, 11, NA, 13, NA),

c2 = c('N', NA, 'A', 'M', 'E'),
c3 = c(НП, 92, НП, НП, 95))

sapply (new_df, функция (x) сумма (is.na (x)))

В этом примере мы создаем DataFrame «new_df» с тремя столбцами — «c1», «c2» и «c3». Первые столбцы, «c1» и «c3», содержат числовые значения, включая некоторые отсутствующие значения, которые представлены NA. Второй столбец, «c2», содержит символы, включая некоторые пропущенные значения, которые также представлены NA. Затем мы применяем функцию sapply() к кадру данных «new_df» и вычисляем количество пропущенных значений в каждом столбце, используя выражение sum() внутри функции sapply().

Функция is.na() — это выражение, указанное для функции sum(), которая возвращает логический вектор, указывающий, отсутствует ли каждый элемент в столбце или нет. Функция sum() складывает значения TRUE, чтобы подсчитать количество пропущенных значений в каждом столбце.

Следовательно, выходные данные отображают общие значения NA в каждом из столбцов:

Пример 5: Использование функции Dim()

Кроме того, мы хотим получить общие столбцы вместе со строками DataFrame. Затем функция dim() предоставляет размеры DataFrame. Функция dim() принимает объект в качестве аргумента, размеры которого мы хотим получить. Вот код для использования функции dim():

d1 <- data.frame(team=c('t1', 't2', 't3', 't4'),

баллы=с(8, 10, 7, 4))

тусклый (d1)

В этом примере мы сначала определяем DataFrame «d1», который создается с помощью функции data.frame(), где два столбца установлены «команда» и «очки». После этого мы вызываем функцию dim() для DataFrame «d1». Функция dim() возвращает количество строк и столбцов DataFrame. Поэтому, когда мы запускаем dim(d1), он возвращает вектор с двумя элементами, первый из которых отражает количество строк в кадре данных «d1», а второй — количество столбцов.

Выходные данные представляют размеры DataFrame, где значение «4» указывает на общее количество столбцов, а значение «2» представляет строки:

Заключение

Теперь мы узнали, что подсчет количества столбцов в R — это простая и важная операция, которую можно выполнять с DataFrame. Среди всех функций функция ncol() является наиболее удобной. Теперь мы знакомы с различными способами получения количества столбцов из данного DataFrame.