«Pandas» — это высокопроизводительный инструмент для среды Python. Это «открытый» исходный код для анализа данных. Соединение pandas и метод слияния pandas используются для объединения двух фреймов данных вместе в один фрейм данных. В обоих методах pandas разница в том, что функция «join» pandas присоединяется к кадру данных с использованием индекса. В то время как функция «слияния» pandas присоединяется к фрейму данных, используя метод индекса и столбца, в котором мы можем сами выбрать нужный столбец. Метод слияния панд используется в основном по сравнению с методом соединения панд. Программное обеспечение, которое мы будем использовать для реализации, — это программное обеспечение «spyder», которое находится в среде python, что предоставит нам преимущества для кодовой реализации метода соединения pandas() и функции метода pandas merge().
Синтаксис метода Pandas Join()
«df1. присоединиться ( дф2 ) ”«df» в приведенном выше синтаксисе является аббревиатурой «dataframe». В синтаксисе есть два кадра данных с функцией «точечное соединение», которая предназначена для вызова метода. Это метод pandas для соединения двух фреймов данных. Он работает, используя индекс для объединения кадров данных в один.
Синтаксис метода Pandas Merge()
«df1. сливаться ( дф2 , на знак равно 'имя_столбца' ) ”Синтаксис метода слияния pandas имеет два фрейма данных: «df1» и «df2». Функция «точечное слияние» вызывает метод соединения обоих фреймов данных с перевернутым видом столбцов.
Мы рассмотрим следующие способы объединения двух фреймов данных, чтобы использовать методы объединения панд и объединения панд:
- Метод Pandas Join перекрывается.
- Панды присоединяются к методу, используя сброс индекса.
- Метод слияния Pandas (столбец «левый и правый»).
- Явный метод слияния Pandas.
Создание фреймов данных для реализации методов Pandas Merge и Pandas Join
Во-первых, мы должны создать фрейм данных. Для этого мы будем использовать инструмент «spyder». Открыв его, приступайте к написанию кода. Импортируйте pandas как «pd» для ассоциации библиотеки pandas. У нас есть переменные фрейма данных как «x», «y», «p» и «q соответственно, а также «a» со значениями «1» и «b» со значением, присвоенным как «2».
Результатом является «df», созданный с назначенными значениями. Мы можем сделать его таким же большим, как данные.
Создание другого фрейма данных
Мы должны сделать еще один кадр данных, чтобы четко понять методы объединения и слияния панд. Здесь у нас есть «df», созданный так же, как и выше «df», только значения присваиваемых переменных разные. У нас есть «h», «j», «s» и «d», тогда как значения «b» присваиваются значению «8» и «Y» значению «3».
Вывод показывает созданный простой «df».
Пример # 01: метод соединения Pandas (перекрытие)
Теперь мы увидим, как соединить два фрейма данных с помощью метода соединения pandas. Для этого метода мы можем выбрать столбец по вашему выбору, над которым мы хотим работать, из фрейма данных. Мы взяли пример с перекрывающимся столбцом «слева» из «df», поэтому мы можем исправить это с помощью «суффикса», чтобы избежать перекрытия данных. Здесь используются переменные «x», «z», «v», «d». «p», «o», «l» и «y» со значениями, назначенными как «3», «6», «7» и «9». «.join» вызывает метод с выравниванием, установленным на левое соединение с правым суффиксом «df». ». «Суффикс», используемый в коде, связан с тем, что в фрейме данных есть два столбца с одинаковым именем, которое является «ключевым» и не будет перекрывать данные.
На выходе не отображаются перекрывающиеся данные с методом соединения двух «df» с использованием метода соединения pandas.
Пример # 02: Метод соединения Pandas с использованием сброса индекса
В этом примере мы отдельно укажем столбец с параметром «on», который будет использоваться в качестве «ключа» в методе соединения, который помогает объединить два фрейма данных. комбинированная вещь делается с этим параметром. Кроме того, индекс одного из двух «df» должен быть одинаковым для их соединения. Подобные виды данных или данные, используемые для одной и той же цели, могут обрабатываться вместе. Это будет использовать индекс по-прежнему, используя справа. Переменными являются «s», «t», «u», «v», «n», «w», «k» и «q». Присваиваются значения «3», «6», «7» и «9». «Сбросить точечный индекс» — это метод pandas для сброса индекса «df». Индекс сброса устанавливает все целые числа вашего списка фреймов данных от 0 до тех пор, пока данные фрейма данных не будут увеличены.
Вот вывод, отображаемый с помощью индексного «ключевого» метода соединения pandas.
Пример #03: Метод слияния Pandas (столбец «слева и справа»)
Метод слияния выполняет ту же операцию, что и метод соединения панд. Оба метода предназначены для объединения данных в одном и том же фрейме данных. Метод слияния более универсален и требует указания ключа. Мы также можем указать его в левой и правой колонках в зависимости от работы вашего фрейма данных. Переменными в коде являются «s», «d», «g», «f», «k», «j», «b» и «q». присвоенные значения: «9», «5», «6» и «7». Внешняя реализация «join» выполняется на обоих «df» с использованием параметра «how» функции метода слияния pandas.
Вывод, который мы видим, показывает объединенные данные двух фреймов данных. «NaN» означает «не число», что означает, что там, где в данных нет номера, отображается «NaN».
Пример # 04: Явный метод слияния
Здесь, в этом примере, метод слияния представляет собой уничтожение индекса, и значение индекса не предполагается в кадре данных. Мы будем использовать этот метод в соответствии с работой, которую необходимо выполнить, где следует явное указание. Он объединит данные на основе левого или правого индекса с параметром. Переменные в этом кадре данных: «t», «r», «I», «u», «h», «o», «e» и «e». Присвоенные значения: «2», «4», «6» и «4». Приведенный выше пример метода слияния pandas с выбором столбца в соответствии с необходимостью является наиболее презентабельным и ценным методом объединения двух кадров данных. Проверка в конце строки кода уникальности ключа слияния в наборе данных.
В приведенном ниже выводе индекс не отображается без индекса, но функция выполняется на основе правого и левого индексов.
Вывод
Методы merge() и join() очень удобны и эффективны. Обе эти функции используются для соединения двух отдельных фреймов данных в одном фрейме данных, но в зависимости от случая они используются по-разному. В этой статье мы узнали о ключевых различиях между методом соединения и слияния pandas. После выполнения примеров и понимания метода соединения панд мы завершим его, зная, что, если мы хотим более гибкого соединения в стиле базы данных, предпочтительнее использовать метод слияния панд. С другой стороны, если мы хотим широко использовать фрейм данных с индексом, мы можем использовать функцию метода pandas join().