电子商务网站建设 项目规划书,艺阳科技网站建设,怎么做网站上做电子书,wordpress淘宝客主题模板最近小编忙着给项目做文档#xff0c;需要阅读大量的文献资料#xff0c;长时间的阅读让本就不喜欢看书的我是又困又乏#xff0c;所以想着#xff0c;要是能有小姐姐在旁边读给我听该有多好。 说干就干#xff0c;小编整理了一下思路#xff0c;晚上熬夜花了几个小时就完… 最近小编忙着给项目做文档需要阅读大量的文献资料长时间的阅读让本就不喜欢看书的我是又困又乏所以想着要是能有小姐姐在旁边读给我听该有多好。 说干就干小编整理了一下思路晚上熬夜花了几个小时就完成了整个小程序一起来跟小编学习一下吧。 01 代码的构思 要完成该任务的设计首先我们需要明确思路整体的设计方案如下图所示 上图中我们首先需要实现的是将PDF文章中我们想要提取的文字提取出来然后再将提取的文本内容通过小姐姐文本朗读转化为MP3文件保存到本地当中。明确思路之后接下来我们就来看一下程序是如何实现的吧。 02 文字提取 对于PDF文档中文字的提取这里我们采用的是pdfplumber库进行提取pdfplumber可以处理PDF中包括文本、表格、格式在内的各种信息小巧但是功能十分的强大。 但是需要注意版本的使用这里我们使用的python3.5环境下的版本号为0.5.25的pdfplumber。对于文本的提取其程序如下所示 上述的程序中我们首先打开pdf文件并返回一个pdf的类对象然后根据指定的pages数据来提取指定页码的文本信息。我们来运行一下程序看一下提取的结果如何吧。 上述的红框中左侧的是程序提取的结果而右侧是PDF的文本通过提取的结果来看pdfplumber能够准确的提取出PDF中的文本信息。 03 文本转语音 提取到文本信息之后接下来就是将文本信息转化为语音信息并保存到本地这里小编采用了两种方式进行实现第一种方式采用的是pyttsx3库进行转换而另一种方式采用的则是百度AI进行实现。程序如下所示 程序首先采用判断的方式如果形参baidu True则采用百度AI否则就采用pyttsx3库。 对于百度AI的调用想必大家都非常的熟悉大家需要到百度的AI开发者平台进行接口的申请然后通过申请的信息来进行百度AI接口的调用。 对于pyttsx3库首先需要初始化语音引擎然后设置语音的声音类型、语速和音量的信息。就可以进行引擎的调用。 结果展示 以上就是对于程序部分的讲解下面小编通过视频展示的方式来看一下程序的运行效果。 最后来听一下小姐姐阅读pdf是什么感觉有点酥麻 以上的内容就是小编今天为大家带来的分享通过这样的处理小编可以解放双眼直接”听文档“大家也赶快下载程序一起学习起来吧 需要本篇的源码后台输入pdf
也可以添加小助手微信小助手获得技术支持暗号pdf菜鸟小助手推荐阅读这个GitHub 1400星的Git魔法书火了斯坦福校友出品丨有中文版贼 TM 好用的 Java 工具类库
超全Python IDE武器库大总结优缺点一目了然
秋招来袭GitHub28.5颗星这个汇聚阿里腾讯百度美团头条的面试题库必须安利
收获10400颗星这个Python库有点黑科技竟然可以伪造很多假的数据
牛掰了这个Python库有点逆天了竟然能把图片视频无损清晰放大
点这里获取一大波福利