Столбец суммы панд

Stolbec Summy Pand



«Эта статья продемонстрирует, как суммировать все или определенные столбцы в Pandas DataFrame с использованием Python. Функция DataFrame.sum() будет использоваться вместе с несколькими полезными параметрами в многочисленных примерах этого руководства».

Когда этот учебник закончится, вы, возможно, узнаете, как:







    • Найдите сумму столбца dataframe в Pandas.
    • Добавление столбцов данных вместе
    • Добавьте столбцы в кадр данных Pandas, которые соответствуют указанному условию.
    • Определите сумму после группировки данных кадра данных.

Как определить сумму столбцов Dataframe?

Функция «dataframe.sum()» в Pandas возвращает общую сумму для указанной оси. Если входными данными является ось индекса, функция добавляет значения каждого столбца по отдельности, затем делает то же самое для каждого столбца, возвращая серию, хранящую сумму данных/значений в каждом столбце. Кроме того, он поддерживает вычисление суммы фрейма данных, игнорируя пропущенные значения.



Синтаксис: DataFrame.sum(ось = Нет, скипна = Нет, уровень = Нет, числовое_только = Нет, минимальное_счетчик = 0, **kwargs)



Где,





ось: {столбцы (1), индекс (0)}

заказ: Игнорировать значения NA/null при вычислении результата.



уровень: Если указанная ось является иерархической (мультииндексной), перед преобразованием в серию необходимо выполнить подсчет до определенного уровня индекса.

числовое_только: Допустимы только столбцы с плавающей запятой, int и логические значения. Если нет, попробуйте использовать все; если нет, то только числовые данные. Для серии не реализовано.

мин_счетчик: Количество возможных значений, необходимых для завершения операции. Результатом будет NA, если присутствует меньше значений, отличных от NA, чем min_count.

Возвращает: DataFrame (если указан уровень) или Series.

Пример № 01: определить сумму столбца фрейма данных и всех столбцов

Сначала нам потребовался фрейм данных с допустимыми типами данных, т. е. int, float и т. д., столбец или столбцы, для которых мы можем найти сумму данных. Фрейм данных будет создан с помощью функции pd.DataFrame().


Мы создали необходимый кадр данных из словаря Python внутри функции pd.DataFrame(). В созданном выше кадре данных есть четыре столбца «Имя», «день1», «день2» и «день3». Из четырех столбцов три столбца, т. е. «день1», «день2» и «день3», представляют собой числовые столбцы со значениями данных (4, 4, 3, 2, 4, 6, 5, 3), (2, 4, 5, 2, 3, 4, 6, 2) и (7, 4, 3, 5, 6, 2, 1, 4) соответственно. Мы можем найти сумму только для этих трех столбцов. Сумма как для ряда (т. е. для столбца), так и для всего фрейма данных может быть определена с помощью метода sum(). Давайте начнем с того, что научимся суммировать все данные в столбце Pandas.


Для определения суммы мы использовали метод sum() в столбце «day2». Функция вернула значение суммы 28. Аналогично этому, мы можем определить сумму каждого столбца Dataframe. Для этого достаточно просто использовать метод sum() для всего фрейма данных.


Как видно, сумма столбца «day1» равна 31; для «day2» значение суммы равно 28, тогда как для столбца «day3» значение суммы равно 32.

Пример # 02: Использование функции sum() для суммирования значений столбцов Dataframe вместе

Как видно из вывода предыдущего примера, функция не вернула фактические данные столбца фрейма данных, составляющие сумму. Однако, назначив метод DataFrame.sum() столбцу DataFrame, вы можете получить доступ к каждому столбцу в DataFrame, включая столбец суммы. Сначала мы создаем еще один фрейм данных для этого примера.


С помощью pd.DataFrame() был создан наш фрейм данных. Мы создали фрейм данных с тремя столбцами: товар, цена и налог. Элемент столбца, содержащий строковые значения («перо», «маркер», «линейка», «ластик», «карандаш», «буфер обмена», «степлер», «булавки»), цена столбца, хранящая значения (20, 15, 10, 3, 5, 30, 35, 10), а столбец «налог» состоит из значений (8, 5, 3, 3, 4, 10, 5, 2). Теперь давайте добавим значения столбцов цены и налога и сохраним результаты в новом столбце, сохранив исходные столбцы фрейма данных.


Как можно заметить, наряду с новым столбцом «итого» функция также возвращает исходные столбцы данного фрейма данных. Столбец «итого» хранит сумму значений столбцов «цена» и «налог» по каждому элементу данных.

Пример # 03: Использование функции sum() для определения суммы указанных столбцов фрейма данных

Чтобы суммировать несколько столбцов фрейма данных вместе, мы можем указать список с метками столбцов, а затем применить метод sum() к списку, чтобы найти сумму. Как и в предыдущих примерах, мы сначала создадим фрейм данных.


Мы создали наш фрейм данных с четырьмя столбцами «студенты», «marks1», «marks2» и «marks3». Столбец «студенты» хранит данные («Ларри», «Джеймс», «Роб», «Арья», «Макс», «Бен», «Гвен», «Билл»), а столбец «marks1» хранит значения (8, 9, 6, 8, 10, 7, 9, 9), тогда как столбцы «marks2» и «marks3» хранят числовые значения (6, 6, 8, 6, 7, 9, 10, 9 ) и (7, 6, 9, 7, 8, 7, 10, 10) соответственно.


Во-первых, мы создали объект списка с метками столбцов «студенты», «marks1» и «marks3». Затем к списку применяется метод sum(). Функция суммировала значения столбцов отметок1 и отметок3 только потому, что столбец «студенты» не является числовым, поэтому функция sum() не может найти сумму значений столбца «студенты». Мы сохранили сумму значений столбцов «marks1» и «marks3» в столбце «сумма».

Пример № 04: добавьте столбцы фрейма данных Pandas, которые удовлетворяют указанному условию

В этом примере мы добавим значения указанных столбцов, если они соответствуют заданному условию.


Во вновь созданном фрейме данных есть 5 столбцов, т. Е. «Компания», «week1_sales», «week2_sales», «week3_sales» и «филиалы». Теперь предположим, что мы не хотим добавлять значение последнего столбца, когда мы добавляем или находим сумму значений заданных строк фрейма данных. Допустим, мы просто хотели добавить значения столбцов со словом «неделя» в их метках. Можно создать понимание списка, чтобы определить, присутствует ли слово «неделя» в метке столбца или нет.


Теперь мы получили столбцы со словом «неделя» в метках. Мы можем суммировать столбцы, содержащие слово «неделя», используя аргумент axis=1 в функции sum().


Таким образом, мы можем безопасно суммировать данные по столбцам построчно, не включая ненужные столбцы.

Пример № 5: определение суммы после группировки данных кадра данных

Мы также можем найти сумму столбцов фрейма данных после группировки данных одного или нескольких столбцов. Метод groupby() будет использоваться для группировки данных по категориям внутри столбца. Давайте создадим фрейм данных, чтобы мы могли сгруппировать данные одного из его столбцов.


Теперь сгруппируем данные в столбце «возраст» и просуммируем значения столбцов «score1» и «score2» для каждой категории группы.


Мы видим, что суммирование данных в кадре данных после первой группировки значений данных по возрасту приводит к сумме по столбцам в зависимости от возрастных групп.

Вывод

В этом уроке мы попытались научить вас, как вычислять сумму по фреймам данных, используя метод суммы Pandas. Мы обсудили сложение значений по строкам и столбцам в примерах этого поста. Кроме того, вы узнали, как условно добавлять столбцы и как суммировать значения после группировки столбца фрейма данных. Теперь вы можете суммировать столбцы фрейма данных вместе или суммировать значения в столбце фрейма данных самостоятельно.