Серия Pandas в CSV

Seria Pandas V Csv



Метод «Series.to_csv()» в Pandas выводит указанный объект серии в нотации значений, разделенных запятыми (csv). Эта функция просто берет значения из ряда и изменяет их формат, добавляя запятые для разделения значений индекса и столбца.

Чтобы использовать эту функцию, мы должны использовать следующий синтаксис:









Эта статья предоставит вам два разных метода, чтобы узнать, как использовать этот метод в программе на Python.



Пример № 1: Использование метода Series.to_csv() для преобразования ряда с DatetimeIndex в значения, разделенные запятыми

Чтобы преобразовать серию в формат CSV, мы будем использовать функцию «Series.to_csv()». На этом рисунке будет создана серия с DatetimeIndex, а затем преобразована в формат значений с разделителями-запятыми.





Для запуска этого метода у нас должен быть инструмент, поддерживающий программирование на Python. Для составления кодов выбран инструмент «Spyder». Чтобы написать на нем скрипт, мы сначала запустили установленный инструмент в нашей системе. Программе на Python нужна библиотека для применения ее методов для достижения требуемого результата. Библиотека, которую мы загрузили здесь, называется «Pandas». В той же строке кода псевдоним этой библиотеки определяется как «pd». Итак, везде в программе нам нужно написать «панды» для доступа к функции. Вместо этого мы напишем «pd».

Первым шагом для начала работы с кодом является создание серии Pandas. Нам нужно написать «pd», чтобы использовать метод создания серий из pandas. Функция «pd.Series()» вызывается для построения серии с указанными значениями. Значения, которые мы предоставили для серии: «Стамбул», «Измир», «Анкара», «Анкара», «Анталья», «Конья» и «Бурса». Если вы хотите дать имя этому массиву значений, вы можете сделать это с помощью параметра «имя». Здесь мы назвали этот массив значений «Города», так как он содержит названия 6 городов. Для хранения этой серии создан объект серии «Турция».



Чтобы создать DatetimeIndex, мы вызвали метод «pd.date_range()». Между скобками этой функции мы передали 4 аргумента: «начало», «частота», «периоды» и «tz».

Аргумент «start» принимает дату и время, чтобы начать генерировать диапазон дат. Здесь мы указали дату и время начала как «2022-03-02 02:30». Параметр «freq» классифицирует частоту для диапазона дат. Итак, мы предоставили ему значение «D». Теперь он создаст диапазон дат с ежедневной частотой. Аргумент «период» имеет значение «6», что означает, что он будет генерировать диапазон дат для 6 дней. Последний параметр — «tz», который указывает часовой пояс для указанной области. Мы указали часовой пояс для «Asia/Istanbul».

Чтобы сохранить этот диапазон дат, мы создали переменную «Datetime». Чтобы установить DatetimeIndex, мы использовали свойство «Series.index». Название серии «Турция» снабжается свойством «.index» и присваивается ему диапазон даты и времени, хранящийся в переменной «Datetime». Таким образом, свойство index возьмет значения из переменной Datetime и сделает их индексным списком серии «Турция». Наконец, для просмотра серии вывода мы использовали метод «print()» и передали серию «Турция» в качестве входных данных для отображения ее содержимого.

Мы просто нажали кнопку «Запустить файл», чтобы выполнить скрипт. Следовательно, мы можем видеть ряд с DatetimeIndex, начиная с «2022-03-02 02:30:00+03:00» и заканчивая «2022-03-07 02:30:00+03:00», создавая период от 6 дней. Ниже серии также упоминаются «Freq :D», имя списка массивов «Cities» и dtype «object».

Теперь мы научимся преобразовывать эту серию, которую мы только что видели на снимке выше, в формат CSV. Чтобы изменить серию на значения, разделенные запятыми, у нас есть метод, предоставляемый модулем pandas, который называется «Series.to_csv()». Этот метод принимает значения предоставленного ряда и добавляет запятые между значениями столбца.

Вызывается функция Series.to_csv(). Название серии, которую мы хотим преобразовать, упоминается в методе как «Turkey.to_csv()». Чтобы сохранить значения, разделенные запятыми, мы создали переменную «Comma_Separated», а затем поместили ее содержимое в окно вывода, вызвав функцию «print()».

Вот наша серия в формате csv. На снимке мы видим, что значения индекса и серии разделены запятыми.

Пример № 2: Использование метода Series.to_csv() для преобразования ряда со значениями NaN в значения, разделенные запятыми

Второй метод применения метода «Series.to_csv()» заключается в применении этого метода для преобразования ряда, содержащего некоторые пустые записи, в формат CSV.

Мы изначально импортировали необходимые пакеты. «pd» создан как псевдоним для pandas, а «np» — как псевдоним для numpy. Инструментарий numpy загружается здесь, потому что мы будем делать некоторые нулевые записи в нашей серии, используя «np.NaN», создавая ее с помощью метода pandas «pd.Series ()».

Функция «pd.Series()» вызывается для построения ряда панд со следующими значениями: «Нил», «Амазонка», np.NaN, «Ганг», «Миссисипи», «np.NaN», «Янцзы», «Дунай», «Меконг», «нп.НаН» и «Волга». Всего для серии определено 21 значение, из которых 3 записи содержат значения «np.NaN», что означает, что 3 значения отсутствуют в серии. Свойство «name» указывает имя для этого массива значений, которое мы предоставили «Titles». Свойство index используется для установки определяемого пользователем списка индексов вместо использования списка по умолчанию.

Здесь нам нужен список индексов со значениями «10», «11», «12», «13», «14», «16», «17», «18», «19», «20», и 21”. Теперь наша серия будет иметь список индексов, начинающийся с «10» вместо «0». Теперь сохраните эту серию, чтобы мы могли использовать ее позже в программе. Мы инициализировали объект серии «Реки» и выделили ему серию вывода, сгенерированную при вызове метода «pd.Series()». Серию можно увидеть, поместив ее на дисплей с помощью функции «print ()» Python.

Обработанный вывод на терминале напечатал серию, список индексов которой начинается с 10 и заканчивается на 21, что означает, что серия имеет 21 значение.

Серия будет преобразована в формат CSV с помощью метода «Series.to_csv()».

Мы вызвали метод «Series.to_csv()» с нашей серией «Турция». Следовательно, этот метод будет брать значения из серии «Турция» и преобразовывать их в формат значений, разделенных запятыми. Результат сохраняется в переменной «Converted_csv». И, наконец, преобразованная серия печатается с помощью функции «print()».

На снимке результата ниже вы можете видеть, что значения ряда теперь изменены таким образом, что запятая используется для их отделения от списка индексов. При этом там, где значения отсутствуют, через запятую печатается только номер индекса.

Вывод

Преобразование серии pandas в формат CSV является практичным подходом. Этого можно добиться с помощью функции pandas «Series.to_csv()». В этом руководстве на практике используются два метода применения этого метода. На первом рисунке мы вызвали этот метод для преобразования ряда с DatetimeIndex в формат значений, разделенных запятыми. Во втором экземпляре использовалась функция Series.to_csv(), чтобы преобразовать серию с некоторыми отсутствующими элементами в формат CSV. Оба метода были реализованы на практике с помощью инструмента «Spyder» в операционной системе Windows.