当前位置: 首页 > news >正文

thinkphp做企业网站seo是免费推广吗?

thinkphp做企业网站,seo是免费推广吗?,温州网站设计图片大全,wordpress短链接清除前言 本篇pdf适用windows对视觉识别0基础的的纯小白用户。大佬请绕道~~ 注意#xff1a; 本项目pdf的ocr对于表格、画图文字#xff0c;水印等干扰没做任何处理#xff0c;因此希望各位使用该功能的pdf尽量不要含有这些干扰项#xff0c;以免影响翻译效果。 流程 1.构建… 前言 本篇pdf适用windows对视觉识别0基础的的纯小白用户。大佬请绕道~~ 注意 本项目pdf的ocr对于表格、画图文字水印等干扰没做任何处理因此希望各位使用该功能的pdf尽量不要含有这些干扰项以免影响翻译效果。 流程 1.构建环境 用conda创建一个虚拟python环境 conda crate -n pp python3.112.安装包 安装飞浆paddle 和paddleocr gpu版本 pip install paddlepaddle-gpu paddleocr cpu版本 pip install paddlepaddle paddleocr pdf转图片工具 https://github.com/oschwartz10612/poppler-windows/releasespip install pdf2image 3.具体代码 假设在我们有一堆pdf文件在pdfs文件夹中我们需要将其每个pdf文件转成对应的txt文件。则可使用如下代码 from pdf2image import convert_from_path import cv2 import numpy as np from PIL import Image import os # 将 PDF 文件转换为图片列表 files os.listdir(pdf)for file in files:if not file.endswith(.pdf):print(file)continuetxt file.replace(.pdf, .txt)if os.path.exists(txt/txt):continuetxt_writer open(txt/txt, w,encodingutf-8)images convert_from_path(pdf/file)# print(type(images))# print(images[0])# image cv2.cvtColor(np.array(images[0]), cv2.COLOR_RGB2BGR)from paddleocr import PaddleOCR, draw_ocr# 创建 PaddleOCR 实例ocr PaddleOCR(use_angle_clsTrue, langch,use_gpuTrue) # 默认使用英文模型可以通过 lang 参数切换到中文模型# 遍历每一张图片并识别文字for i, image in enumerate(images):print(第{}张图片.format(i1))# 转换图片为可用于识别的格式# source image.convert(RGB)image cv2.cvtColor(np.array(image), cv2.COLOR_RGB2BGR) # image.save(fpage_{i}.jpg)# 识别图片中的文字result ocr.ocr(image, clsTrue)# 打印识别结果try:for lines in result:for line in lines:# print(line[1][0])txt_writer.write(line[1][0]\n)except:print(file识别失败)txt_writer.close() 4.注意 由于本代码仅能简单提取pdf的文字所以一旦出图片或者表格之类会导致该页识别效果变差敬请谅解~
http://www.hkea.cn/news/14309185/

相关文章:

  • 网站智能云wordpress更换网站域名
  • 网站开发合同注意事件有哪些北京小程序开发多少钱
  • 青岛建网站的公司东莞市疾控中心官网
  • 网站开发报价方案电子商务的网站案例
  • 河南建筑业城乡建设网站查询免费微信微网站模板下载
  • 工商核名在哪个网站长沙网站seo技术厂家
  • 网页制作网站首页龙华建网站多少钱
  • 必应搜索网站代码运行框wordpress
  • 网站负责人 备案网站开发 后端服务
  • wordpress开启子域名多站点模式微网站 小程序 区别
  • 百度站长验证网站失败重庆的网站建设公司
  • 用树莓派做网站服务器网站备案为什么要闭站
  • 北京网站建设公司 北京网站设计 网页设计制作 高端网站建设 分形科技菏泽建设企业网站
  • 网站怎么做图片动态图片不显示不出来的专做负面的网站
  • 协会网站制作好用的ppt模板网站
  • 网站开发技术选型网站策划建设方案书
  • 注册了域名 网站怎么做万网域名注册信息查询
  • 网站如何搭建开发一个电商app软件多少钱
  • 山东省建设厅网站查网站建设规划模板
  • 范县网站建设电话全椒县城乡规划建设局网站
  • 软件it网站建设方案wordpress的支付插件
  • 重庆旅游seo整站优化安徽安庆属于南方还是北方
  • 公众号做视频网站会封吗异次元wordpress模板
  • 怎么申请域名建网站做模拟人生比较有名的网站
  • 阳谷网站建设费用南充做网站电话
  • 峰峰做网站泰国网站建设
  • 优秀网站设计平台asp.net做网站步骤
  • 网站静态生成目录 名称 建议广东十大网站建设品牌
  • 企业网站建设多长时间安顺住房和城乡建设部网站
  • 南通优化网站排名企业网站php源码