当前位置: 首页 > news >正文

免费成品网站模板wordpress数据库名字

免费成品网站模板,wordpress数据库名字,给您更优质的服务体验,php 网站开发流程图前言 本文对使用python读取pdf、word、excel、ppt、csv、txt等常用文件#xff0c;并提取所有文本的方法进行分享和使用总结。 可以读取不同文件的库和方法当然不止下面分享的这些#xff0c;本文的代码主要目标都是#xff1a;方便提取文件中所有文本的实现方式。 这些库的…前言 本文对使用python读取pdf、word、excel、ppt、csv、txt等常用文件并提取所有文本的方法进行分享和使用总结。 可以读取不同文件的库和方法当然不止下面分享的这些本文的代码主要目标都是方便提取文件中所有文本的实现方式。 这些库的更多使用方法请到官方文档中查阅。 读取PDF文本PyPDF2 import PyPDF2def read_pdf_to_text(file_path):with open(file_path, rb) as pdf_file:pdf_reader PyPDF2.PdfReader(pdf_file)contents_list []for page in pdf_reader.pages:content page.extract_text()contents_list.append(content)return \n.join(contents_list)read_pdf_to_text(xxx.pdf)读取Word文本docx2txt doc需先手动转换成docx import docx2txtdef read_docx_to_text(file_path):text docx2txt.process(file_path)return textread_docx_to_text(xxx.docx)读取excel文本pandas 当然pandas能读取的文件不仅仅是excel还包括csv、json等。 import pandas as pddef read_excel_to_text(file_path):excel_file pd.ExcelFile(file_path)sheet_names excel_file.sheet_namestext_list []for sheet_name in sheet_names:df excel_file.parse(sheet_name)text df.to_string(indexFalse)text_list.append(text)return \n.join(text_list)read_excel_to_text(xxx.xlsx)读取ppt文本pptx from pptx import Presentationdef read_pptx_to_text(file_path):prs Presentation(file_path)text_list []for slide in prs.slides:for shape in slide.shapes:if shape.has_text_frame:text_frame shape.text_frametext text_frame.textif text:text_list.append(text)return \n.join(text_list)read_pptx_to_text(xxx.pptx)读取csv、txt其他文本直接openread() def read_txt_to_text(file_path):with open(file_path, r) as f:text f.read()return textread_txt_to_text(xxx.csv) read_txt_to_text(xxx.txt)读取任何文件格式 有了前面的所有函数那我们可以写一个支持传任意格式文件的函数。 support {pdf: read_pdf_to_text,docx: read_docx_to_text,xlsx: read_excel_to_text,pptx: read_pptx_to_text,csv: read_txt_to_text,txt: read_txt_to_text, }def read_any_file_to_text(file_path):file_suffix file_path.split(.)[-1]func support.get(file_suffix)if func is None:return 暂不支持该文件格式text eval(func)(file_path)return textread_any_file_to_text(xxx.pdf) read_any_file_to_text(xxx.docx) read_any_file_to_text(xxx.xlsx) read_any_file_to_text(xxx.pptx) read_any_file_to_text(xxx.csv) read_any_file_to_text(xxx.txt)结语 以上就是全部常见的文件格式的读取和提取所有文本的全部内容了。 更多其他的使用方法请查阅官方文档。
http://www.hkea.cn/news/14330701/

相关文章:

  • 小型购物网站开发费用wordpress导出xml
  • seo网站推广优化论文富顺做网站
  • 如何架设网站服务器免费网站100m
  • 音乐网站系统源码苏州网站优化企业
  • 大连网站排名优化价格网站建设设计ppt
  • 网站建设百度认证做铁艺需要什么网站
  • 免费网站无需下载直接观看公司外宣网站
  • 佛山网站推广建设做论坛网站怎么样备案
  • 网站代理商深圳ui设计培训班
  • 建设网站广州市个人公司怎么样注册公司
  • 深圳企业网站定制公司网站中文域名收费吗
  • 精品课程网站源码旅游网页有哪些
  • 郑州七彩网站建设公司伊春网站建设
  • 云游戏免费平台网站的seo
  • 杭州怎么做网站做网站分前台后端吗
  • 怎样做百度推广网站恩施旅游网站建设
  • 网站加入百度地图系统安装wordpress
  • 有没有医学生做课件的网站在线crm平台
  • 长春建站优化加徽信xiala5产品线上营销有哪些方式
  • 三合一网站建设口碑好怎样设计网站首页
  • 网站广告图怎么做免费网站设计平台
  • php做的网站后台做网站网站被抓没盈利
  • 做试管网站福田补贴每人9000元
  • 网络广告公司排名重庆seo按天收费
  • html框架做网站网站后台登陆模板
  • 在线查看qq空间网站自己做的网站打开很慢
  • 网站备案 机构需要什么手续wordpress外部链接
  • seo整站优化新站快速排名怎么把做的网站放到腾讯云里面
  • 珠海企业集团网站建设吉林关键词优化的方法
  • 阿里巴巴国际站wordpress加载很慢