Python 操作 Word 文件
要操作 Word 文件,我们需要使用一个 Python 的第三方库叫做 python-docx
。它可以让我们使用 Python 对 Word 文件进行读取、修改以及创建等操作。
安装
你可以使用 pip
命令来安装 python-docx
库:
pip install python-docx
读取 Word 文件
我们可以使用 docx.Document()
函数来打开一个 Word 文档。下面是一个简单的例子:
import docx
document = docx.Document('demo.docx')
这里把 demo.docx
文档打开,并赋值给变量 document
。
我们可以使用 paragraphs
属性来访问文档中所有的段落。下面是一个例子:
for para in document.paragraphs:
print(para.text)
这里使用了一个 for 循环来遍历文档中的每一个段落,并打印出它们的文本内容。
修改 Word 文件
我们可以使用 paragraph
和 run
对象来修改文档中的内容。paragraph
对象代表一个段落,而 run
对象代表一个文本块。
下面是一个简单的例子,它会把文档中所有的段落内容转换成大写:
for para in document.paragraphs:
for run in para.runs:
run.text = run.text.upper()
document.save('new_demo.docx')
这里遍历文档中的每一个段落和文本块,并把它们的文本全部转换成大写。然后使用 save()
函数将更改后的文档保存为新的文件 new_demo.docx
。
创建 Word 文件
我们可以使用 docx.Document()
函数来创建一个新的 Word 文档。下面是一个例子:
import docx
document = docx.Document()
document.add_heading('Hello, World!', 0)
document.add_paragraph('This is a paragraph.')
document.save('new_doc.docx')
这里使用 add_heading()
和 add_paragraph()
函数来添加一个标题和一个段落。然后使用 save()
函数将文档保存为新的文件 new_doc.docx
。
这样,我们就学会了使用 Python 操作 Word 文件的基本方法。使用 python-docx
库,可以很方便地读取、修改以及创建 Word 文档。