当前位置: 首页 > news >正文

可视化网站建设软件有哪些遵义网站建设90kj

可视化网站建设软件有哪些,遵义网站建设90kj,定制网站开发公司生物医药,做网站放网站广告一、PDF文件介绍 PDF是英文Portable Document Format缩写#xff0c;就是可移植的意思#xff0c;它是以PostScript语言图象模型为基础#xff0c;无论在哪种打印机上都可保证精确的颜色和准确的打印效果#xff0c;PostScript咱也不懂#xff0c;估计和SVG的原理差不多吧…一、PDF文件介绍 PDF是英文Portable Document Format缩写就是可移植的意思它是以PostScript语言图象模型为基础无论在哪种打印机上都可保证精确的颜色和准确的打印效果PostScript咱也不懂估计和SVG的原理差不多吧。 二、PDF文件格式 PDF文件是二进制数据可以用Sublime的HexViewer打开。 1、首部 指明文件PDF版本号%PDF-1.4 其中最后一位 4就是文件格式的版本号。 2、文件体 PDF文件主要部分由一系列obj对象组成类似如下格式 3 0 obj ........endobj# 3 对象编号 0 修改次数 3、交叉引用表 用于索引各个obj 对象在文档中的位置以实现随机访问 xref.0 180000000000 65535 f0000010112 00000 n.....# 0000000000 第一对象起始地址修改次数 65535#最大修改次数表示不可再改 f 表示free # 这里可以看成文件头# 0000010112 第二对象超始地址n表示对象正在使用 4、尾部 指明文件体根对象和交叉引用表地址 trailer./Info 17 0 R/ID [df2c5533d0ab7c62ee7732a5e375592ab07f35295e287c0a5febcad25060ccbf]/Root 16 0 R/Size 18.startxref.83511.%%EOF.# trailer 说明文件尾 trailer对象的开始# Size 18 该PDF文件的对象数目# Root 16 根对象的对象号为16# startxref.83511 交叉引用表地f址 三、解析PDF文件 Java PdfBox、Python的Pdfminer都可以解析出PDF中的文本但无论哪个工具都只能把PDF文本一行行打印出来具体的字段解析还是要自己用正则去匹配。 下面介绍一下Python3的pdfminer3k 1、安装 pip install pdfminer3k 2、pdfminer3k几个主要类介绍 PDFParser从PDF文件中提取数据PDFDocumentPDF文档对象PDFPageInterpreter处理页面内容 下面是解析简历PDF数据需要把关键信息提取出来刚从网上找了些代码简单实现了一下代码还没有做任何异常处理先能跑通再说。 注这代码对扫描版本的PDF是没有办法解析出来的。
http://www.hkea.cn/news/14316404/

相关文章:

  • 青岛黄岛区网站开发零用贷网站如何做
  • 黄骅贴吧招聘2022年seo sem论坛
  • 广州网站制作方法凡客建站
  • 荣添网站建设优化西安做营销型网站
  • 网站3级目录可以做导航分类么做游戏直播那个网站
  • 网站 开发逻辑网站建设应该有什么特点
  • 网站友情链接怎么样做公司管理
  • 成功的营销网站的例子考研培训班哪个机构比较好
  • 门户网站直接登录系统名师工作室网站建设建议
  • 深圳深圳网站建设重庆发布公众号
  • 网站网页建设与维护黄村网站建设报价
  • 重庆绝美的十大冷门景点六安网站排名优化电话
  • 建立网站怎么申请工信部网站备案系统
  • 腾讯网站站内面包屑导航杭集手工活外发加工网
  • 不花钱可以做网站吗wordpress后台没有菜单
  • 网站宣传页面公司网站建设费分录
  • 网站备案的要求是什么样的手机个别网页打不开
  • 毕业答辩为什么做网站学校网站建设的申请书
  • 国外网站模板欣赏做名片用什么网站
  • 帝国cms网站地产公司网站建设
  • 沙漠风网站建设网站建设技术合伙人的技术股份
  • 合肥网站建设方案网站空间代理
  • 做面食网站安卓app开发需要的技术
  • 有自己网站做淘宝客赚钱吗wordpress多主题插件下载
  • 网站开发与技术维护廊坊关键词排名首页
  • 哪里有最新的网站源码政协网站 两学一做专题研讨
  • 备案网站有哪些免费网站建设模板
  • 镇海建设银行网站剖析材料范文哪个网站做的好
  • 公司网站规划案例烟台做网站要多少钱
  • 电子商务网站功能模块72建站网