Word 转图片
是什么:将 Word 文档的每一页转换为单独的图片文件。
为什么:方便在网页、移动端展示,防止内容被修改。
Python 示例
python
from pdf2image import convert_from_path
import subprocess
import os
def word_to_images(docx_path, output_folder="images"):
"""Word 转多张图片(每页一张)"""
# 创建输出文件夹
os.makedirs(output_folder, exist_ok=True)
# 1. Word 转 PDF
subprocess.run([
'libreoffice', '--headless', '--convert-to', 'pdf', docx_path
], capture_output=True)
# 2. PDF 转多张图片
pdf_path = docx_path.replace('.docx', '.pdf')
images = convert_from_path(pdf_path, dpi=150)
# 3. 保存每页为图片
for i, image in enumerate(images):
image_path = os.path.join(output_folder, f"page_{i+1}.jpg")
image.save(image_path, "JPEG", quality=95)
print(f"生成: {image_path}")
# 清理临时文件
os.remove(pdf_path)
print(f"转换完成,共 {len(images)} 页")
# 使用示例
word_to_images("document.docx", "word_images")
安装依赖:
bash
pip install pdf2image pillow # 系统还需安装:LibreOffice 和 poppler-utils
一句话总结:通过 LibreOffice 将 Word 转为 PDF,再将每页导出为独立图片,完美保持原始格式。