当前位置: 首页 > news >正文

淮南网站建设费用wordpress wpdoc

淮南网站建设费用,wordpress wpdoc,logo设计公司企业,系统维护一般要多长时间CRNN#xff1a;用于识别图中文本的深度学习模型 CRNN介绍#xff1a;用于识别图中文本的深度学习模型CRNN的结构组成部分工作原理 CRNN结构分析卷积层#xff08;Convolutional Layers#xff09;递归层#xff08;Recurrent Layers#xff09;转录层#xff08;Transc… CRNN用于识别图中文本的深度学习模型 CRNN介绍用于识别图中文本的深度学习模型CRNN的结构组成部分工作原理 CRNN结构分析卷积层Convolutional Layers递归层Recurrent Layers转录层Transcription Layer CRNN在文本识别中的应用识别不定长文本单词和场景文本的识别强大的泛化能力 CRNN的优势与局限性优势局限性 CRNN介绍用于识别图中文本的深度学习模型 在计算机视觉和机器学习的领域中文本识别是一个重要的研究领域它旨在从图像中检测和识别文字。CRNNConvolutional Recurrent Neural Network卷积递归神经网络是这个领域内的一个代表性的框架它融合了卷积神经网络CNN和递归神经网络RNN特别适用于对图像中的序列文本进行识别。 CRNN的结构 组成部分 CRNN模型主要包含三个部分一个用于提取图像特征的卷积层序列、一个用于序列建模的递归层序列和一个转录层将递归层的输出解码为一个文本序列。 工作原理 卷积层负责提取图像的特征这些特征随后被展平并输入到递归层。在递归层中RNN处理输入序列并且能够在序列的每个时间步捕捉上下文信息。这对于理解文本的意义尤其重要因为文本的特定字符通常需要对前文和后文的了解。最后是转录层通常使用CTC即Connectionist Temporal Classification对RNN的输出进行解码生成最终的文本序列。 CRNN结构分析 卷积层Convolutional Layers CRNN的第一部分是一系列卷积层用于从输入图像中提取视觉特征。设输入图像为 I 通过 L 层卷积操作后得到的特征图feature map为 F L c o n v ( I ; W L , b L ) F^L conv(I; W^L, b^L) FLconv(I;WL,bL) 其中 W^L和 b^L 分别代表第 L 层的卷积权重和偏置。卷积操作提取的特征 F^L将被送入后续的递归层进行进一步的处理。 递归层Recurrent Layers 递归层的作用是对特征序列进行建模捕捉序列中的时间依赖性。最常用的RNN单元是长短时记忆LSTM它在处理长序列数据时表现出色。LSTM有三个门控机制遗忘门 f_t输入门 i_t 和输出门 o_t 。LSTM单元中在时间步 t 的状态更新公式如下 遗忘门: f t σ ( W f ⋅ [ h t − 1 , x t ] b f ) f_t \sigma(W_f \cdot [h_{t-1}, x_t] b_f) ft​σ(Wf​⋅[ht−1​,xt​]bf​) 输入门: i t σ ( W i ⋅ [ h t − 1 , x t ] b i ) i_t \sigma(W_i \cdot [h_{t-1}, x_t] b_i) it​σ(Wi​⋅[ht−1​,xt​]bi​) 输出门: o t σ ( W o ⋅ [ h t − 1 , x t ] b o ) o_t \sigma(W_o \cdot [h_{t-1}, x_t] b_o) ot​σ(Wo​⋅[ht−1​,xt​]bo​) 新记忆单元内容: C ~ t tanh ⁡ ( W C ⋅ [ h t − 1 , x t ] b C ) \tilde{C}_t \tanh(W_C \cdot [h_{t-1}, x_t] b_C) C~t​tanh(WC​⋅[ht−1​,xt​]bC​) 记忆单元更新: C t f t ∗ C t − 1 i t ∗ C ~ t C_t f_t * C_{t-1} i_t * \tilde{C}_t Ct​ft​∗Ct−1​it​∗C~t​ 隐藏状态更新: h t o t ∗ tanh ⁡ ( C t ) h_t o_t * \tanh(C_t) ht​ot​∗tanh(Ct​) 在CRNN中通常使用双向LSTMBi-LSTM在每个时间步 t 同时考虑先前h_{t-1} 和后续h_{t1} 的上下文信息。 转录层Transcription Layer CRNN的最后部分是转录层负责将递归层的输出映射到最终的序列标签。转录通常通过CTCConnectionist Temporal Classification完成CTC利用概率论原理解决无对齐数据的序列学习问题其目标是最大化条件概率 P ( π ∣ x ) P(\pi|x) P(π∣x) 其中π表示一个路径它通过删除重复的标签和空白标签来映射到最终的标签序列l 。CTC的目标函数定义如下 P ( l ∣ x ) ∑ π ↦ l P ( π ∣ x ) P(l|x) \sum_{\pi \mapsto l} P(\pi|x) P(l∣x)π↦l∑​P(π∣x) 该函数对所有可能映射到标签序列 l 的路径π的概率求和。 CRNN在文本识别中的应用 识别不定长文本 CRNN特别适用于识别图像中的不定长文本。它不需要预先定义文本的长度这给识别流程带来了极大的灵活性。 单词和场景文本的识别 CRNN不仅可以在图像中识别单个字符或者单词还能很好地工作在识别自然场景中的文本如街道标志、广告牌等。 强大的泛化能力 CRNN已被证实在多个文本识别数据集上表现出色并能够很好地泛化到新的、未见过的图像。 CRNN的优势与局限性 优势 端到端学习: CRNN能够从原始图像直接学习到文本识别所需要的最终输出无需手动特征提取或其他预处理步骤。对于图像扭曲的鲁棒性: CRNN对图像的畸变和扭曲有很好的适应性提高了模型在现实世界应用的实用性。 局限性 计算成本: CRNN结合了CNN和RNN两个复杂的模型可能导致较高的计算成本。训练数据: 获得大量带有标注的训练数据对于训练CRNN模型来说至关重要但这有时候可能既昂贵又耗时。
http://www.hkea.cn/news/14466455/

相关文章:

  • 模板网站平台滨海网站建设找哪家好
  • 网站开发经理ipv6可以做网站吗
  • 平顶山做网站推广北京网站设计济南兴田德润评价
  • 广东企业网站seo哪里好建设监理工程公司网站
  • 青岛建站通wordpress有什么局限性
  • 餐饮团购网站建设互联网技术培训学校
  • 如何确保网站安全seo刷关键词排名工具
  • 深圳市建设工程质量监督总站网站电子商务网站建设重要性
  • 手机网站可以直接做百度推广不画册封面设计
  • 做购物网站的目的wordpress 页面怎么添加表格
  • 网站结构网站开发怎么找客户
  • 网站的ftp上传地址国外著名室内设计网址
  • 自动化毕设题目网站开发网站建设技术服务方案
  • 潮州市建设工程交易中心网站wordpress 维护状态
  • 专业网站推广服务咨询湖南网站营销推广
  • 如何利用div做网站微商城开店
  • 周口航迪科技网站建设公司怎么样山东省住房建设厅网站首页
  • php cms系统专业网站seo优化公司
  • 高端html5网站建设的思路查域名注册
  • 在上海做家教的网站网站开发常用插件
  • 电商平台正在建设中网站页面提示移动网站建设推广
  • wordpress 不显示时间seo搜索引擎优化论文
  • 网站 只做程序员sae wordpress
  • 汕头网站建设设计价格重庆 手工 制作
  • 网站制作评分标准家做网站
  • 昆山建设工程信息网站网站更新维护 怎么做
  • 好的网站2020wordpress精美免费主题
  • 建筑类招聘网站有哪些宁波企业建网站报价
  • mvc3网站上传到空间wordpress 中英插件
  • 网站程序和数据库哈尔滨广告制作公司