Запись pandas DataFrame в Excel с разными форматами для разных столбцов

Я пытаюсь написать pandas DataFrame в файл .xlsx, где разные числовые столбцы будут иметь разные форматы. Например, некоторые отображали бы только два десятичных знака, некоторые не отображали бы ни одного, некоторые были бы отформатированы как проценты с символом «%» и т. д.

Я заметил, что DataFrame.to_html() имеет параметр formatters, который позволяет делать именно это, сопоставляя разные форматы с разными столбцами. Однако в методе DataFrame.to_excel() нет аналогичного параметра. Самое большее, что у нас есть, это float_format, глобальное для всех чисел.

Я прочитал много сообщений SO, которые хотя бы частично связаны с моим вопросом, например:

Используйте старый механизм openpyxl для применения форматов к одной ячейке за раз< /а>. Это подход, с которым я добился наибольшего успеха. Но это означает написание циклов для применения форматов к ячейкам, запоминание смещений и т. д.

Отображение процентов путем преобразования самих данных таблицы в строки. Переход по пути изменения фактических данных вдохновил меня попробовать разобраться с форматированием десятичных знаков, вызвав round() для каждого столбца перед записью в Excel — это тоже работает, но я хотел бы избежать изменения данных.
Ассорти других, в основном о форматах даты

Существуют ли другие более удобные функции/свойства, связанные с Excel, в API pandas, которые могут помочь здесь, или что-то похожее на openpyxl, или, возможно, какой-то способ указать метаданные формата вывода непосредственно для каждого столбца в DataFrame, которые затем будут интерпретироваться нижестоящими различными выходы?

sparc_spread 30.04.2015 источник

comment

как насчет удаления ВСЕХ форматов? Кто-нибудь знает, есть ли быстрый способ сделать это? - Lisle 19.01.2017

Ответы (2)

arrow_upward
12
arrow_downward

Вы можете сделать это с помощью Pandas 0.16 и механизма XlsxWriter, обратившись к базовой книге и объектам рабочего листа:

import pandas as pd

# Create a Pandas dataframe from some data.
df = pd.DataFrame(zip(
    [1010, 2020, 3030, 2020, 1515, 3030, 4545],
    [.1, .2, .33, .25, .5, .75, .45],
    [.1, .2, .33, .25, .5, .75, .45],
))

# Create a Pandas Excel writer using XlsxWriter as the engine.
writer = pd.ExcelWriter('test.xlsx', engine='xlsxwriter')
df.to_excel(writer, sheet_name='Sheet1')

# Get the xlsxwriter objects from the dataframe writer object.
workbook  = writer.book
worksheet = writer.sheets['Sheet1']

# Add some cell formats.
format1 = workbook.add_format({'num_format': '#,##0.00'})
format2 = workbook.add_format({'num_format': '0%'})
format3 = workbook.add_format({'num_format': 'h:mm:ss AM/PM'})

# Set the column width and format.
worksheet.set_column('B:B', 18, format1)

# Set the format but not the column width.
worksheet.set_column('C:C', None, format2)

worksheet.set_column('D:D', 16, format3)

# Close the Pandas Excel writer and output the Excel file.
writer.save()

Выход:

введите здесь описание изображения

См. также Работа с Python Pandas и XlsxWriter.

jmcnamara 01.05.2015

arrow_upward
3
arrow_downward

Как вы правильно заметили, применение форматов к отдельным ячейкам крайне неэффективно.

openpyxl 2.4 включает встроенную поддержку фреймов данных Pandas и именованных стилей.

https://openpyxl.readthedocs.io/en/latest/changes.html#id7

Charlie Clark 01.05.2015

Запись pandas DataFrame в Excel с разными форматами для разных столбцов

Ответы (2)

Похожие вопросы