当前位置: 首页 > news >正文

企业网站建设需注意点济南建站培训

企业网站建设需注意点,济南建站培训,虚拟服务器和如何创建网站,网站设计 评价 方法要批量提取增值税发票的关键信息并将其导出为 Excel 文件#xff0c;可以使用 Python 脚本结合 pdfplumber#xff08;用于解析 PDF 内容#xff09;、pandas#xff08;用于处理数据并导出 Excel#xff09;等库来实现。以下是实现这一目标的详细步骤。 1. 环境设置 首…要批量提取增值税发票的关键信息并将其导出为 Excel 文件可以使用 Python 脚本结合 pdfplumber用于解析 PDF 内容、pandas用于处理数据并导出 Excel等库来实现。以下是实现这一目标的详细步骤。 1. 环境设置 首先需要安装所需的 Python 库 pip install pdfplumber pandas openpyxl2. 编写 Python 脚本 import pdfplumber import pandas as pd import os# 要处理的PDF文件夹路径 pdf_folder path_to_your_pdf_folder # 输出Excel文件路径 output_excel output.xlsx# 定义存储提取信息的列表 data []# 遍历文件夹中的所有PDF文件 for filename in os.listdir(pdf_folder):if filename.endswith(.pdf):pdf_path os.path.join(pdf_folder, filename)with pdfplumber.open(pdf_path) as pdf:# 假设发票信息在第一页解析第一页内容first_page pdf.pages[0]text first_page.extract_text()# 提取关键信息下面是一些假设的示例正则表达式invoice_number find_value_by_keyword(text, 发票号码)invoice_date find_value_by_keyword(text, 开票日期)buyer_name find_value_by_keyword(text, 购买方名称)buyer_tax_id find_value_by_keyword(text, 购买方纳税人识别号)service_name find_value_by_keyword(text, 货物或应税劳务、服务名称)quantity find_value_by_keyword(text, 数量)unit_price find_value_by_keyword(text, 单价)amount find_value_by_keyword(text, 金额)tax_rate find_value_by_keyword(text, 税率)tax_amount find_value_by_keyword(text, 税额)total_amount find_value_by_keyword(text, 价税合计)seller_name find_value_by_keyword(text, 销售方名称)seller_tax_id find_value_by_keyword(text, 销售方纳税人识别号)# 将提取的信息添加到列表中data.append({PDF文件名: filename,发票号码: invoice_number,开票日期: invoice_date,购买方名称: buyer_name,购买方纳税人识别号: buyer_tax_id,服务名称: service_name,数量: quantity,单价: unit_price,金额: amount,税率: tax_rate,税额: tax_amount,价税合计: total_amount,销售方名称: seller_name,销售方纳税人识别号: seller_tax_id})# 将数据导出到Excel df pd.DataFrame(data) df.to_excel(output_excel, indexFalse)print(f提取完成结果已保存到 {output_excel})def find_value_by_keyword(text, keyword):# 定义一个简单的提取函数实际需要根据发票格式调整lines text.split(\n)for i, line in enumerate(lines):if keyword in line:return line.replace(keyword, ).strip()return 3. 脚本说明 PDF文件名: 使用 os.listdir 遍历指定文件夹中的所有 PDF 文件。PDF解析: 使用 pdfplumber 打开并读取 PDF 内容假设发票内容位于第一页。关键字提取: 使用 find_value_by_keyword 函数从文本中提取关键信息该函数可以根据实际情况调整正则表达式。数据存储: 将提取的信息存储在列表中最后将列表转换为 DataFrame 并导出为 Excel 文件。 4. 注意事项 发票格式: 此示例假设发票的格式是一致的如果格式有变动可能需要调整关键字提取的逻辑。正则表达式: 如果发票内容较复杂可以使用正则表达式进行更精准的匹配。 5. 运行脚本 将脚本保存为 .py 文件修改 pdf_folder 路径为你的 PDF 文件夹路径运行脚本后提取的信息将会被导出为一个 Excel 文件。
http://www.hkea.cn/news/14404905/

相关文章:

  • 制作网站培训学校建设银行官方网站登
  • 如何建立属于自己的网站WordPress资讯网站
  • 西安百度网站快速优化中国500强企业
  • 对网站建设课程的心得体会谷歌浏览器下载安装2022最新版
  • 虚拟网站鸿扬家装
  • 网站地图样式佛山seo外包平台
  • 苏州网推广网站建设江苏金地建设工程有限公司网站
  • 广州网站制作公司联系方式美妆网站建设环境分析
  • 辛集建设网站工程招标建设部指定网站
  • 专业网站策划 西安wordpress新奇插件
  • 电子商务网站建设项目范围手机版谷歌浏览器入口
  • 联盟营销网站有哪些腾讯做的购物网站
  • 招设计师在哪里找网站seo顾问
  • 只放一个图片做网站网址大全123下载安装
  • 长沙岳麓区网站建设销售平台网站建设方案模板
  • 网路营销网站策划书莒南做网站
  • 上海网站建设极简慕枫wordpress 卸载
  • 城乡住房建设厅网站遵义网站推广
  • 做网站和推广的公司哪家好本地搭建多个网站
  • 做平面的就一定要做网站吗移动端和pc端的区别
  • 青岛网站制作哪里有龙岩网站设计 贝壳下拉
  • 成为网站建设人员措施潍坊网站制作保定公司
  • 极验验证 wordpress济南做seo的公司排名
  • 新网网站负责人核验现场拍摄照片电子件网站建设的论文
  • 网站接入支付宝在线交易怎么做广告公司好听的名字
  • 商城网站有哪些怎么设置网站默认首页
  • 网站建设可行性方案模板在线定制手机壳
  • 做网站费用入什么科目asp网站 seo
  • 重庆建工建筑工程信息网太原网站搜索优化
  • html5模板网站北京地产网站建设