语音识别如何改善电信业客服体验

原创 英伟达NVIDIA中国 2023-06-27 21:05


近年来,电信业出现了大量 AI 驱动的技术,尤其是语音识别和翻译。多语种 AI 虚拟助手、数字人、聊天机器人、语音客服、音频转录等技术正在大幅改变电信业。企业正在呼叫中心部署 AI 以加快解决来电请求的速度,大幅提升客户体验、员工留存率和品牌声誉。


例如,自动语音识别(ASR)语音转文本已被用于实时对话转录,这使企业能够迅速为客户确定资源或解决方案。语音 AI 还被用于分析情绪、识别分歧来源、提高合规性和坐席表现等。


本文将深入探讨语音识别在电信业的变革力量,并着重介绍 AT&T、T-Mobile 等行业领导者如何利用这些最先进的技术在其呼叫中心提供无与伦比的客户体验。


语音转文字对改善客户服务的影响


语音转文字技术的落地已为客服领域带来了巨大改变。通过实现呼叫路由、呼叫分类和语音认证等任务的自动化,企业可以大大缩短客户的等待时间并将其转接至最适合处理该请求的坐席。


语音识别还可以用于 AI 驱动的客户反馈分析,帮助改善客户满意度、产品和服务。凭借语音转文字赋能的 AI 应用,企业可以准确识别并及时满足客户需求。


AT&T 数据科学 AI 助理副总裁 Jeremy Fix 在 GTC23 上概述了该公司使用 AI 改善呼叫中心体验的主要原因:

  • 优化人员配置资源

  • 提供个性化的客户体验

  • 协作坐席提供可执行的洞察


资源优化


充足的人员配置是呼叫中心的关键组成部分之一,包括吸引和维系最好的人才。AT&T 通过 AI 预测呼叫中心坐席与来电数量的平衡情况,为坐席提供发挥其最佳水平所需的支持。


个性化


通过了解客户首次接通时的意图,AT&T 可以将来电者与之前解决过类似问题并且向客户适时提供相关方案的资深坐席相匹配。


语音客服


AT&T 结合呼叫转录以及自然语言处理(NLP)驱动的洞察引擎,为坐席及管理人员提供实时、可操作的洞察,帮助他们做出智能化的决策并提供高质量的客户服务(视频 1)。


视频 1. GTC23 上的 AT&T 洞察引擎演示


如何能做到实时的呢?在通话过程中,AT&T 的 NLP 引擎使用实时转录和文本挖掘技术识别讨论主题,然后推荐后续最佳行动、识别通话情绪、预测客户满意度,甚至评估坐席质量和合规性。


常见的语音转文本准确性问题


尽管语音 AI 可以帮助呼叫中心做出重大改进,但要成功落实语音转文本仍面临着一些挑战。T-Mobile 的首席机器学习工程师 Heather Nolis 在 GTC23 期间谈到了这些挑战:

  • 语音歧义

  • 不同的说话风格

  • 嘈杂的环境

  • 电话的局限性

  • 特定领域的词汇


语音歧义


您有多少次在打电话时误解了别人的意思?比如是“上了一艘邮轮”还是“上了一艘油轮”?这种听起来相同,但含义不同的词语会造成语音歧义。如果语音转文字应用没有经过训练,无法按照上下文识别单词,就会导致转写错误。


视频 2. 语音歧义


不同的说话风格


每个人都会有不同的口音、方言和口腔生理结构,这意味着我们所说的每个词语听起来都会有所不同。对于全球运营的呼叫中心来说,必须在训练数据集中捕捉到这些微妙的差别,从而提高语音识别的准确性。


视频 3. 不同说话风格背后的原因包括生理结构差异和我们学习说话的方式


嘈杂的环境


呼叫中心坐席在与客户对话时可能受到背景噪声、同时说话的人、麦克风质量不佳,甚至手机信号不良等干扰,这些都会导致电话中的声音丢失。部署到呼叫中心的强大语音转文字应用必须能够承受这类环境。


视频 4. 噪声源包括背景噪声、同时说话的人和麦克风质量


电话的局限性


电话的局限性,包括无法记录 “S”、“F” 等某些声音会进一步阻碍语音转文字的准确性。例如,即便您在电话中听到 “free for all Friday” 这句话时实际上没有听到未被电话传送的 “f” 这个音,但您的大脑仍会将 “f” 这个音补进去。而在转录过程中,就得由语音转文本模型来填补缺失的声音。


特定领域的词汇


每一座为企业创建的呼叫中心都会遇到具有不同主题和词汇的企业场景。开箱即用的 ASR 解决方案一般未经过有效的定制化,因此在现实中很少有用。


T-Mobile 展示了他们应对语音识别问题的解决方案。该方案采用 NVIDIA Riva(一款用于构建和部署自定义语音应用的 GPU 加速 SDK)并使用 NVIDIA NeMo (对特定领域的数据进行微调)。T-Mobile 在不同口音、不同说话风格和嘈杂生产环境等干扰下,将语音识别准确率提高了 3 倍(图 1)。

图 1. T-Mobile ASR 准确率*:从位于云端到高度定制化的 Riva 语音转文本(*准确率[%]=100-WER


实现最佳语音转文字结果的首要因素


从电信呼叫中心和紧急服务到视频会议和广播,企业在部署最先进的语音 AI 技术时必须考虑准确度、延迟、可扩展性、安全性、运营成本等诸多因素,以便在竞争中保持领先地位。


企业正在不断寻找将呼叫中心变成价值中心的新办法,而成本在这方面起到至关重要的作用。呼叫数量多的企业必须根据定价模式、总体运营成本(TCO)和隐藏成本评估厂商。


实现全方位的语言、口音和方言覆盖对所有语言的语音识别准确性都至关重要。值得高兴的是,语音AI在多语种准确性上已经取得了很大的进步。例如,Riva 现在可以为英语、西班牙语、普通话、印地语、俄语、阿拉伯语、日语、韩语、德语、葡萄牙语、法语和意大利语提供全球领先的语音识别。


最后,语音 AI 模型必须实现低延迟才能为坐席和客户提供更好的实时体验。如果在坐席与客户对话的过程中,AI 无法足够快地向坐席提供有关后续行动的建议,那就会变得毫无用处。


T-Mobile 详细介绍了他们的语音转文本评估流程,展示了一项重要的发现—— Riva 语音识别在延迟、成本效益和准确性方面均优于当前的云供应商模型。


视频 5. T-Mobile 的语音转文本评估指标:延迟、成本效益和准确性


在 GTC23 专题讨论会“使用先进的语音 AI 技术引领潮流”上,Infosys、Quantiphi 和摩托罗拉分享了他们通过在电信解决方案中部署语音 AI 解决这些问题的经验。


要点总结


将语音和翻译 AI 集成到客服 AI 解决方案中正在给电信行业带来变革。通过使用客户会话的实时多语种转录,电信公司可以更好地对来电进行分类和转接,并向坐席提供有价值的洞察和个性化的建议。


拥抱这项技术的电信公司可凭借提供卓越的客户体验、在竞争中保持领先并满足客户不断变化的需求,从而获得在市场中的竞争优势。




点击 “阅读原文”,或扫描下方海报二维码观看 NVIDIA 创始人兼 CEO 黄仁勋在 COMPUTEX 2023 的主题演讲直播回放,主题演讲中文字幕版已上线,了解 AI、图形及其他领域的最新进展!


评论
  • 最近几年,新能源汽车愈发受到消费者的青睐,其销量也是一路走高。据中汽协公布的数据显示,2024年10月,新能源汽车产销分别完成146.3万辆和143万辆,同比分别增长48%和49.6%。而结合各家新能源车企所公布的销量数据来看,比亚迪再度夺得了销冠宝座,其10月新能源汽车销量达到了502657辆,同比增长66.53%。众所周知,比亚迪是新能源汽车领域的重要参与者,其一举一动向来为外界所关注。日前,比亚迪汽车旗下品牌方程豹汽车推出了新车方程豹豹8,该款车型一上市就迅速吸引了消费者的目光,成为SUV
    刘旷 2024-12-02 09:32 131浏览
  • 11-29学习笔记11-29学习笔记习学习笔记&记录学习学习笔记&记录学习学习笔记&记录学习学习笔记&记录学习笔记&记录学习习笔记&记学习学习笔记&记录学习学习笔记&记录学习习笔记&记录学习学习笔记&记录学习学习笔记记录学习学习笔记&记录学习学习笔记&记录学习学习笔记&记录学习学习笔记&记录学习学习笔记&记录学习习笔记&记录学习学习笔记&记录学习学习笔记&记录学习学习笔记&记录学习学习笔记&记录学习学习笔记&记录学习学习笔记&记录学习学习笔记&学习学习笔记&记录学习学习笔记&记录学习学习笔记&记
    youyeye 2024-12-02 23:58 90浏览
  •         温度传感器的精度受哪些因素影响,要先看所用的温度传感器输出哪种信号,不同信号输出的温度传感器影响精度的因素也不同。        现在常用的温度传感器输出信号有以下几种:电阻信号、电流信号、电压信号、数字信号等。以输出电阻信号的温度传感器为例,还细分为正温度系数温度传感器和负温度系数温度传感器,常用的铂电阻PT100/1000温度传感器就是正温度系数,就是说随着温度的升高,输出的电阻值会增大。对于输出
    锦正茂科技 2024-12-03 11:50 140浏览
  • 概述 说明(三)探讨的是比较器一般带有滞回(Hysteresis)功能,为了解决输入信号转换速率不够的问题。前文还提到,即便使能滞回(Hysteresis)功能,还是无法解决SiPM读出测试系统需要解决的问题。本文在说明(三)的基础上,继续探讨为SiPM读出测试系统寻求合适的模拟脉冲检出方案。前四代SiPM使用的高速比较器指标缺陷 由于前端模拟信号属于典型的指数脉冲,所以下降沿转换速率(Slew Rate)过慢,导致比较器检出出现不必要的问题。尽管比较器可以使能滞回(Hysteresis)模块功
    coyoo 2024-12-03 12:20 156浏览
  • 光伏逆变器是一种高效的能量转换设备,它能够将光伏太阳能板(PV)产生的不稳定的直流电压转换成与市电频率同步的交流电。这种转换后的电能不仅可以回馈至商用输电网络,还能供独立电网系统使用。光伏逆变器在商业光伏储能电站和家庭独立储能系统等应用领域中得到了广泛的应用。光耦合器,以其高速信号传输、出色的共模抑制比以及单向信号传输和光电隔离的特性,在光伏逆变器中扮演着至关重要的角色。它确保了系统的安全隔离、干扰的有效隔离以及通信信号的精准传输。光耦合器的使用不仅提高了系统的稳定性和安全性,而且由于其低功耗的
    晶台光耦 2024-12-02 10:40 134浏览
  • RDDI-DAP错误通常与调试接口相关,特别是在使用CMSIS-DAP协议进行嵌入式系统开发时。以下是一些可能的原因和解决方法: 1. 硬件连接问题:     检查调试器(如ST-Link)与目标板之间的连接是否牢固。     确保所有必要的引脚都已正确连接,没有松动或短路。 2. 电源问题:     确保目标板和调试器都有足够的电源供应。     检查电源电压是否符合目标板的规格要求。 3. 固件问题: &n
    丙丁先生 2024-12-01 17:37 111浏览
  • 作为优秀工程师的你,已身经百战、阅板无数!请先醒醒,新的项目来了,这是一个既要、又要、还要的产品需求,ARM核心板中一个处理器怎么能实现这么丰富的外围接口?踌躇之际,你偶阅此文。于是,“潘多拉”的魔盒打开了!没错,USB资源就是你打开新世界得钥匙,它能做哪些扩展呢?1.1  USB扩网口通用ARM处理器大多带两路网口,如果项目中有多路网路接口的需求,一般会选择在主板外部加交换机/路由器。当然,出于成本考虑,也可以将Switch芯片集成到ARM核心板或底板上,如KSZ9897、
    万象奥科 2024-12-03 10:24 86浏览
  • TOF多区传感器: ND06   ND06是一款微型多区高集成度ToF测距传感器,其支持24个区域(6 x 4)同步测距,测距范围远达5m,具有测距范围广、精度高、测距稳定等特点。适用于投影仪的无感自动对焦和梯形校正、AIoT、手势识别、智能面板和智能灯具等多种场景。                 如果用ND06进行手势识别,只需要经过三个步骤: 第一步&
    esad0 2024-12-04 11:20 94浏览
  • 当前,智能汽车产业迎来重大变局,随着人工智能、5G、大数据等新一代信息技术的迅猛发展,智能网联汽车正呈现强劲发展势头。11月26日,在2024紫光展锐全球合作伙伴大会汽车电子生态论坛上,紫光展锐与上汽海外出行联合发布搭载紫光展锐A7870的上汽海外MG量产车型,并发布A7710系列UWB数字钥匙解决方案平台,可应用于数字钥匙、活体检测、脚踢雷达、自动泊车等多种智能汽车场景。 联合发布量产车型,推动汽车智能化出海紫光展锐与上汽海外出行达成战略合作,联合发布搭载紫光展锐A7870的量产车型
    紫光展锐 2024-12-03 11:38 121浏览
  • 遇到部分串口工具不支持1500000波特率,这时候就需要进行修改,本文以触觉智能RK3562开发板修改系统波特率为115200为例,介绍瑞芯微方案主板Linux修改系统串口波特率教程。温馨提示:瑞芯微方案主板/开发板串口波特率只支持115200或1500000。修改Loader打印波特率查看对应芯片的MINIALL.ini确定要修改的bin文件#查看对应芯片的MINIALL.ini cat rkbin/RKBOOT/RK3562MINIALL.ini修改uart baudrate参数修改以下目
    Industio_触觉智能 2024-12-03 11:28 104浏览
我要评论
0
点击右上角,分享到朋友圈 我知道啦
请使用浏览器分享功能 我知道啦