研讨会预告|使用Transducer模型优化语音识别结果

英伟达NVIDIA中国 2023-03-08 20:23 913浏览 0评论 0点赞

TOLG 技术采用超紧凑的海鸥翼式引脚设计 工程师速看！中端示波器软件升级“隐藏福利”曝光

在 ASR 自动语音识别领域，基于 CTC 的声学模型不再需要对训练的音频序列和文本序列进行强制对齐，实际上已经初步具备了端到端的声学模型建模能力。但是 CTC 模型进行声学建模存在着两个严重的瓶颈，一是缺乏语言模型建模能力，不能整合语言模型进行联合优化，二是 CTC 有一个不合理的假设：标签相互独立，这个基本假设与语音识别任务之间存在着一定程度的背离，因为在语言系统中存在语境的上下文关系。因此针对 CTC 的不足，Transducer 模型可以弥补这种不合理的假设，解决 CTC 的问题。

3 月 9 日，NVIDIA 企业开发者社区经理李奕澎将面向有 NLP 和 Speech AI 开发需求的开发者，在本次研讨会中重点讨论 Transducer 模型，并通过代码来训练和评估 Transducer 模型。

Transducer 模型在自动语音识别中的应用 – NVIDIA NeMo 代码解析

3 月 9 日，星期四，20:00 - 21:30

主要内容：

本次网络研讨会主要面向有 NLP 和 Speech AI 开发需求的开发者。通过本次网络研讨会，您可以获得以下信息：

Transducer 介绍
Transducer loss 的优势和局限
Transducer 的模型架构
ContextNet 的模型架构
Transducer 模型的训练和评估

演讲嘉宾

李奕澎 | NVIDIA 企业开发者社区经理

拥有多年数据分析建模、人工智能自然语言处理开发经验。在自动语音识别、自然语言处理、语音合成等对话式 AI 技术领域有丰富的实战经验与见解。曾开发法律、金融、保险文档中基于实体抽取的智能问答系统，曾开发基于 NLP 知识抽取，KG 知识图谱的建立的科研文档智能检索系统。

参与方式

识别二维码注册本次研讨会

相关资料

识别二维码了解 NVIDIA NeMo 更多信息

点击 “阅读原文” 或扫描下方海报二维码，即可免费注册 GTC23，在 3 月 24 日听 OpenAI 联合创始人与 NVIDIA 创始人的炉边谈话，将由 NVIDIA 专家主持，配中文讲解和实时答疑，一起看 AI 的现状和未来！

登录阅读全文



免责声明：该内容由专栏作者授权发布或作者转载，目的在于传递更多信息，并不代表本网赞同其观点，本站亦不保证或承诺内容真实性等。若内容或图片侵犯您的权益，请及时联系本站删除。侵权投诉联系： nick.zong@aspencore.com！

英伟达NVIDIA中国

进入专栏

评论（0）

英伟达NVIDIA中国

文章：1976篇粉丝：14人

关注  私信

最近文章

广告

推荐

工程师速看！中端示波器软件升级“隐藏福利”曝光

中端示波器性能提升“秘籍”

AI、GUI开发的工程师必修课，不容错过！

GaN电机驱动设计“避坑”指南

在线研讨会

E聘热招职位

资料

文库

帖子

博文

分享到

评论

0

点赞