Как читать файл excel (xlsx) в python

How Read Excel File Python



В .xlsx является расширением документа Excel, который может хранить большой объем данных в табличной форме, и многие типы арифметических и логических вычислений могут быть легко выполнены в электронной таблице Excel. Иногда для программирования требуется прочитать данные из документа Excel с помощью скрипта Python. В Python существует множество модулей для чтения документа Excel. Некоторые из полезных модулей: xlrd , openpyxl , а также панды . В этом руководстве показаны способы использования этих модулей для чтения файла Excel в Python.

Предварительные условия:

Для проверки примеров этого руководства потребуется фиктивный файл Excel с расширением .xlsx. Вы можете использовать любой существующий файл Excel или создать новый. Здесь новый файл Excel с именем sales.xlsx файл был создан со следующими данными. Этот файл использовался для чтения с помощью различных модулей Python в следующей части этого руководства.







sales.xlsx



Дата продажи Продавец Количество
12.05.18 Сила Ахмед 60000
06.12.19 Me Hossain 50 000
09.08.20 Сармин Джахан 45000
07.04.21 Махмудул Хасан 30000

Пример-1: чтение файла Excel с помощью xlrd

По умолчанию модуль xlrd не устанавливается вместе с Python. Итак, вам необходимо установить модуль перед его использованием. Последняя версия этого модуля не поддерживает файл Excel с расширением .xlsx. Итак, вам необходимо установить версию 1.2.0 этого модуля, чтобы читать файл xlsx. Выполните следующую команду из терминала, чтобы установить требуемую версию xlrd .



$пипустановить xlrd== 1.2.0

После завершения процесса установки создайте файл python со следующим сценарием, чтобы прочитать sales.xlsx файл с использованием XLRD модуль. open_workbook () Функция используется в скрипте открытия файла xlsx для чтения. Этот файл Excel содержит только один лист. Так что workbook.sheet_by_index () функция была использована в скрипте со значением аргумента 0. Затем вложенный 'для' Цикл использовался для чтения значений ячеек рабочего листа с использованием значений строк и столбцов. В скрипте используются две функции range () для определения размера строки и столбца на основе данных листа. В cell_value () функция использовалась для чтения конкретного значения ячейки листа на каждой итерации цикла. Каждое поле в выводе будет разделено одним пробелом табуляции.





# Импортируем модуль xlrd
импортировать xlrd

# Открыть книгу
workbook = xlrd.open_workbook('sales.xlsx')

# Откройте рабочий лист
рабочий лист = workbook.sheet_by_index(0)

# Итерировать строки и столбцы
дляявдиапазон(0,5):
дляjвдиапазон(0,3):
# Распечатать значения ячеек с пробелом
Распечатать(worksheet.cell_value(я, j),конецзнак равно' т')
Распечатать('')

Выход:

Следующий вывод появится после выполнения вышеуказанного сценария.



Пример-2: чтение файла Excel с помощью openpyxl

В openpyxl - это еще один модуль Python для чтения файла xlsx, и он также не устанавливается вместе с Python по умолчанию. Выполните следующую команду из терминала, чтобы установить этот модуль перед его использованием.

$пипустановитьopenpyxl

После завершения процесса установки создайте файл python со следующим сценарием, чтобы прочитать sales.xlsx файл. Как и модуль xlrd, openpyxl модуль имеет load_workbook () функция открытия файла xlsx для чтения. В sales.xlsx файл используется как значение аргумента этой функции. Объект wookbook.active был создан в скрипте для чтения значений max_row и max_column характеристики. Эти свойства использовались во вложенных циклах for для чтения содержимого sales.xlsx файл. Функция range () использовалась для чтения строк листа, а функция iter_cols () использовалась для чтения столбцов листа. Каждое поле в выводе будет разделено двумя пробелами табуляции.

# Импортировать модуль openyxl
импортировать openpyxl

# Определить переменную для загрузки wookbook
wookbook = openpyxl.load_workbook('sales.xlsx')

# Определить переменную для чтения активного листа:
рабочий лист = wookbook.active

# Итерируем цикл для чтения значений ячеек
дляявдиапазон(0, worksheet.max_row):
для с вworksheet.iter_cols(1, worksheet.max_column):
Распечатать(с[я].ценить,конецзнак равно' т т')
Распечатать('')

Выход:

Следующий вывод появится после выполнения вышеуказанного сценария.

Пример-3: чтение файла Excel с помощью pandas

Модуль pandas не устанавливается вместе с предыдущим модулем, подобным python. Итак, если вы не устанавливали его раньше, вам необходимо установить его. Выполните следующую команду, чтобы установить панды с терминала.

$пипустановитьпанды

После завершения процесса установки создайте файл python со следующим сценарием, чтобы прочитать sales.xlsx файл. В read_excel () Функция панд используется для чтения файла xlsx. Эта функция использовалась в сценарии для чтения sales.xlsx файл. В DataFrame () функция использовала здесь для чтения содержимого файла xlsx во фрейме данных и сохранения значений в переменной с именем данные . Значение данных было напечатано позже.

# Импортировать панд
импортные пандыв качествеpd

# Загрузите файл xlsx
excel_data = pd.read_excel('sales.xlsx')
# Прочитать значения файла в фрейме данных
data = pd.DataFrame(excel_data,столбцызнак равно['Дата продажи','Продавец','Количество'])
# Распечатать содержимое
Распечатать('Содержимое файла: п', данные)

Выход:

Следующий вывод появится после выполнения вышеуказанного сценария. Результат этого сценария отличается от двух предыдущих примеров. Номера строк печатаются в первом столбце, где значение строки отсчитывается от 0. Значения даты выравниваются по центру. Имена продавцов выровнены по правому краю. Сумма выравнивается по левому краю.

Заключение:

Пользователям python необходимо работать с файлами xlsx для различных целей программирования. В этом руководстве были показаны три различных способа чтения файла xlsx с использованием трех модулей Python. Каждый модуль имеет разные функции и свойства для чтения файла xlsx. Это руководство поможет пользователям python легко прочитать файл xlsx с помощью сценария python после прочтения этого руководства.