Python 数据持久化 - Openpyxl 模块

Microsoft 的 Excel 是最流行的电子表格应用程序。 它已经使用了 25 年多。 Excel 的更高版本使用 Office Open XML (OOXML) 文件格式。 因此,通过其他编程环境访问电子表格文件成为可能。

OOXML 是一种 ECMA 标准文件格式。 Python 的 openpyxl 包提供了读取/写入扩展名为 .xlsx 的 Excel 文件的功能。

openpyxl 包使用类似于 Microsoft Excel 术语的类命名法。 Excel 文档称为工作簿,在文件系统中以 .xlsx 扩展名保存。 一个工作簿可能有多个工作表。 工作表显示了一个大的单元格网格,每个单元格都可以存储值或公式。 形成网格的行和列已编号。 列由字母 A、B、C、...、Z、AA、AB 等标识。 行从 1 开始编号。

一个典型的 Excel 工作表如下所示 −

Excel 工作表

pip 实用程序足以安装 openpyxl 包。

pip install openpyxl

Workbook 类代表一个带有一张空白工作表的空工作簿。 我们需要激活它,以便可以将一些数据添加到工作表中。

from openpyxl import Workbook
wb=Workbook()
sheet1=wb.active
sheet1.title='StudentList'

我们知道,工作表中的单元格被命名为 ColumnNameRownumber 格式。 因此,左上角的单元格是 A1。 我们将一个字符串分配给这个单元格 −

sheet1['A1']= 'Student List'

或者,使用工作表的 cell() 方法,该方法使用行号和列号来标识单元格。 调用 value 属性给单元格对象赋值。

cell1=sheet1.cell(row=1, column=1)
cell1.value='Student List'

用数据填充工作表后,通过调用工作簿对象的 save() 方法保存工作簿。

wb.save('Student.xlsx')

此工作簿文件在当前工作目录中创建。

以下 Python 脚本将元组列表写入工作簿文档。 每个元组存储学生的 Name、age 和 marks。

from openpyxl import Workbook
wb = Workbook()
sheet1 = wb.active
sheet1.title='Student List'
sheet1.cell(column=1, row=1).value='Student List'
studentlist=[('RollNo','Name', 'age', 'marks'),(1,'Juhi',20,100), 
   (2,'dilip',20, 110) , (3,'jeevan',24,145)]
for col in range(1,5):
   for row in range(1,5):
      sheet1.cell(column=col, row=1+row).value=studentlist[row-1][col-1]
wb.save('students.xlsx')

工作簿 students.xlsx 保存在当前工作目录中。 如果使用 Excel 应用程序打开,则显示如下 −

Excel 应用程序

openpyxl 模块提供了load_workbook() 函数来帮助读取工作簿文档中的数据。

from openpyxl import load_workbook
wb=load_workbook('students.xlsx')

您现在可以访问由行号和列号指定的任何单元格的值。

cell1=sheet1.cell(row=1, column=1)
print (cell1.value)
Student List

示例

以下代码使用工作表数据填充列表。

from openpyxl import load_workbook
wb=load_workbook('students.xlsx')
sheet1 = wb['Student List']
studentlist=[]
for row in range(1,5):
   stud=[]
for col in range(1,5):
   val=sheet1.cell(column=col, row=1+row).value
stud.append(val)
studentlist.append(tuple(stud))
print (studentlist)

输出

[('RollNo', 'Name', 'age', 'marks'), (1, 'Juhi', 20, 100), (2, 'dilip', 20, 110), (3, 'jeevan', 24, 145)]

Excel 应用程序的一个非常重要的特性是公式。 要为单元格分配公式,请将其分配给包含 Excel 公式语法的字符串。 将 AVERAGE 函数分配给具有年龄的 c6 单元格。

sheet1['C6']= 'AVERAGE(C3:C5)'

Openpyxl 模块具有 Translate_formula() 函数,可在一定范围内复制公式。 以下程序在 C6 中定义了 AVERAGE 函数,并将其复制到 C7 中计算平均分数。

from openpyxl import load_workbook
wb=load_workbook('students.xlsx')

sheet1 = wb['Student List']
from openpyxl.formula.translate import Translator#copy formula
sheet1['B6']='Average'
sheet1['C6']='=AVERAGE(C3:C5)'
sheet1['D6'] = Translator('=AVERAGE(C3:C5)', origin="C6").translate_formula("D6")
wb.save('students.xlsx')

更改后的工作表现在显示如下 −

更改工作表