网站 加域名,做网站颜色类型是啥,网站开发案例代码,ppt模板百度网盘python -从文件夹批量提取pdf文章的第n页#xff0c;并存储起来
废话不多说#xff0c;看下面代码
讲解一下下面代码
reader PyPDF2.PdfReader (file) 将文件转化为PdfReader 对象#xff0c;方便使用内置方法。 first_page reader.pages[0] 提取第一页
writer PyPDF…python -从文件夹批量提取pdf文章的第n页并存储起来
废话不多说看下面代码
讲解一下下面代码
reader PyPDF2.PdfReader (file) 将文件转化为PdfReader 对象方便使用内置方法。 first_page reader.pages[0] 提取第一页
writer PyPDF2.PdfWriter () writer.add_page (first_page) writer.write(output_file) 将代码写入对应位置
def process_folder(folder_path):# 遍历文件夹中的所有文件for filename in os.listdir(folder_path):if filename.endswith(.pdf):pdf_path os.path.join(folder_path, filename)print(pdf_path)output_path os.path.join(D:\data\pdf_output, filename[0:-4](首页).pdf)# 提取第一页并保存为同名文件extract_first_page(pdf_path, output_path)print(fProcessed {filename})读取某个文件夹下的所有pdf文件并调用函数取出第一页并写下来。
import os
import PyPDF2def extract_first_page(pdf_path, output_path):# 打开PDF文件with open(pdf_path, rb) as file:reader PyPDF2.PdfReader (file)# 获取第一页first_page reader.pages[0]# 写入新PDF文件with open(output_path, wb) as output_file:writer PyPDF2.PdfWriter ()writer.add_page (first_page)writer.write(output_file)def process_folder(folder_path):# 遍历文件夹中的所有文件for filename in os.listdir(folder_path):if filename.endswith(.pdf):pdf_path os.path.join(folder_path, filename)print(pdf_path)output_path os.path.join(D:\data\pdf_output, filename[0:-4](首页).pdf)# 提取第一页并保存为同名文件extract_first_page(pdf_path, output_path)print(fProcessed {filename})# 指定你的文件夹路径
folder_path D:\data\pdf
process_folder(folder_path)