当前位置: 首页 > news >正文

佛山网站设计是贺兰县住房城乡建设局网站

佛山网站设计是,贺兰县住房城乡建设局网站,北京seo优化化,给别人做网站需要增值电信又到了一年一度的背题时刻#xff0c;但是收到的题库是Word版的#xff0c;页数特别多 话不多说#xff0c;上代码#xff0c;有图有真相#xff0c;代码里面备注的很详细 # 导入所需库 import csv import os import refrom docx import Document from win32com import c…又到了一年一度的背题时刻但是收到的题库是Word版的页数特别多 话不多说上代码有图有真相代码里面备注的很详细 # 导入所需库 import csv import os import refrom docx import Document from win32com import client as wc# 打开word文档def doc_to_docx(doc_file):full_path os.path.abspath(doc_file) # 绝对路径便于分离文件位置、名和后缀word wc.Dispatch(Word.Application)doc word.Documents.Open(full_path)doc.SaveAs(os.path.splitext(full_path)[0] .docx, 12) # 保存只改后缀 12 为docxdoc.Close()word.Quit()return os.path.splitext(full_path)[0] .docxdef save_to_csv(doc_name, date): # date为list [[1],[2],[3]...]name os.path.abspath(doc_name)# os.path.splitext(name)[0]out open(f{os.path.splitext(name)[0]}.csv, a, encodingutf-8, newline)csv_write csv.writer(out, dialectexcel)for row in date:csv_write.writerow(row)out.close()print(f文件{os.path.splitext(name)[0]}.csv生成完毕请查看)if __name__ __main__:为防止格式错乱请先在源文件里执行将^l替换为^p操作默认每个题目开头序号都是数字,如果不是需要修改question_start_num对应的re代码file_name input(请输入word文件名带后缀:) # 2.docTG_style 一二三四五六七八九、 # 大题干类型最后一位为符号choose_split 、 # 选项分割符号A、 A.if file_name.endswith(.doc): # 加快处理速度.docx比doc处理速度快所以如果不是x结尾的转成x的file_name doc_to_docx(file_name)document Document(file_name)# 获取所有段落all_paragraphs document.paragraphsstart_num 0 # 主干序号下角序号TX # 题型All_content [] # 存储所有题内容tem [] # 临时存储每个题类型、题干、选项、答案for paragraph in all_paragraphs:# 打印每一个段落的文字# print([paragraph.text])tittle_split 、question_start_num re.compile(f^\d) # 识别题干头是否是数字p re.compile(f^{TG_style[start_num] TG_style[-1]}) # 匹配开头字符筛选出大标号区分题目类型tittle_ret question_start_num.search(paragraph.text) # 识别题干头ret p.search(paragraph.text) # 识别题型if ret:TX paragraph.text.replace((TG_style[start_num] TG_style[-1]), , 1)start_num 1# tittle_num 1# print(TG)All_content.append(tem)tem []All_content.append([paragraph.text]) # 读完题型说明进入了题目内容else:if tittle_ret: # 是否是题干All_content.append(tem) # 如果是题干证明上一题遍历完毕进行缓存tem [TX] # 保存题型在第一位# print(f{TG}{paragraph.text})# tittle_num 1 # 遇到题号不连续时继续处if All_content: # 不是题干缓存写了说明在读取选项此处为了区分一行有多个选项的情况逐个读取出来chooses re.split(f[A-Za-z]{choose_split}, paragraph.text)for choose in chooses:if choose.replace( , ): # 替换掉选项中空格进行过滤#print(choose)tem.append(choose)save_to_csv(file_name, All_content) 题库已打包有环境的直接RUN有问题可以咨询不保证一定解决
http://www.hkea.cn/news/14338831/

相关文章:

  • 免费网站空间和域名微信端网站开发流程图
  • wordpress网站流量统计插件在网上怎么注册公司
  • 网站内容图片怎么做网站登不了企业建设网银
  • 葫芦岛建设厅网站wordpress后台排版错乱
  • 成都网站开发多少钱怎么免费搭建平台
  • 保定网站电话wordpress加载视频教程
  • 高新区网站建设郑州app外包公司
  • 域名注册网站查询工具东莞做网站制作
  • 视频播放网站开发教程北京有哪些软件公司
  • 网站首页被降权怎么做余姚公司做网站
  • 南宁网站seo公司哪家好自己做网站代码
  • 网站介绍流程世界500强企业排名2024最新名单
  • 企业网站建设的要求如何利用问答类网站做推广
  • 在重庆_那里可以做诚信网站认证室内设计理念
  • python网站开发视频教程湖北网站推广公司技巧
  • 如何设计制作一般的企业网站番禺网站建设番禺网络营销
  • 在网站上做支付功能 需要什么活动列表 wordpress
  • 金融网站cms最好的手表网站
  • 公司微网站建设汕头市网站建设分站公司
  • SEO做得最好的网站网站建设 海外房产
  • 洪雅网站建设wordpress简洁音乐播放器
  • 东城网站开发公司wordpress二維碼
  • 网站上线后做什么做小程序公司哪家好
  • 邢台网站建设厂家建站宝盒是什么
  • 建设网站公司电话销售话术网站建设公司知乎
  • 关于网站项目建设的申请企业网站文案外包
  • 免费做团购网站的软件好网站建设如何获取客户
  • 章丘市建设局网站wordpress注册系统
  • 小说网站做公众号好还是网站好网站建设需要什么专业
  • 网站开发多少人响应式网站 移动端网站