AI实时互动方案:10分钟打造一个企业专属云上智能体

原创 阿里云视频云 2024-09-05 19:41

我们打造了一款满足想象与应用的智能体——AI 实时互动。



谈谈 AI 智能体



当 AI 变得足够聪明时,用户与 AI 的交互将变得真实自然。于是,构建高拟真 AI 与用户的实时交互,已经成为企业提升数智化生产力的新思路。

在这个交互过程中,存在一个极具活力的对象,就是智能体(AIAgent)

顾名思义,“智能体”利用人工智能,能够基于内部状态、感知到的信息或外部输入,来做出决策并执行动作。它具有一定程度的自治性和智能性,等同于一个自主性的网络实体可发挥的想象空间不言而喻。

AI 智能体的衍生,可以突破更高的效率、营造更好的链接深入场景里,它能为企业塑造 7*24 小时、不限并发的“真实在线”的高质量服务,能为孩子匹配专属的智慧互动教育陪伴者;能为每个人在日常生活中配备专业领域的网络私人教练;能在买家和卖家之间构建高效的沟通链路;能在无人商超打造 7*24 小时的专属售卖员......它为任何需要数字交互的领域,赋予全新的体验,意义非凡。

回归产品,回归商业,阿里云视频云为此推出全新的「AI 实时互动」方案。

该方案已正式上线阿里云官网,并在 7 月 31 日发布了语音通话智能体(VoiceAgent)、8 月 31 日发布了数字人通话智能体(AvatarAgent)



10 分钟,构建企业专属云上智能体



阿里云全新推出的 AI 实时互动方案,其深度整合了阿里云在 AI、实时音视频 ARTC 的能力积累,助力企业打造高拟人化、超低延时、高可靠的人机交互体验。

产品架构图

正如 AI 智能体的应用空间更多是创新领域,于是,开发上线的效率对企业的快速商业探索,是至关重要的。阿里云 AI 实时互动方案正满足这一核心,能够帮助企业 10 分钟构建专属云上智能体

「AI 实时互动」提供白屏化、可插拔的 AI 组件编排工作流,通过控制台可以将 STT(语音转文本)、TTS(文本转语音)、LLM(大语言模型)、数字人等 AI 组件进行灵活编排无需企业组建专属团队从零开发真正实现 10 分钟快速构建专属智能体的目标,让企业更专注在业务内核以及智能体上线所驱动的价值。

具体来看,通过如下的控制台实时编排图例,用户可以感受如何用 10 分钟快速构建企业的专属 AI 智能体。

AI实时互动控制台实时编排图例

再者,作为端到端的 AI 通话解决方案,「AI 实时互动」提供完善的 AI 智能体客户端集成方案,以低代码、场景化 API 快速接入让使用更具低门槛、高灵活的属性。对此,企业仅需调用 OpenAPI,即可启动云端 AI 智能体任务,同时在客户端配套实时字幕、AI 状态回调、AI 智能体生命周期管理等场景化接口,所有集成仅需 1 天内即可实现



低门槛之上,真正的 AI 超拟人体验



AI 智能体的智能与否,一定取决于交互人性化的程度,考验的是超低时延下 AI 对人的理解和输出能力所以,拥有一个超拟人质感的专属智能体,是交互在商业应用上的一大跨越。

阿里云的 AI 实时互动,超拟人化是首要特点。

然而,实现超拟人化并非易事,需要突破几个关键点:互动延时、智能降噪、高拟人音色、智能意图识别。在这四个维度的打磨上,「AI 实时互动」有卓越的能力呈现:


  • 自然延时:在 AI 实时互动中,用户与 AI 的通话延时低至 1.5 秒(即从用户说话结束至收到 AI 反馈的响应时间),以最自然的延时,实现用户与 AI 的人机沟通。

  • 智能降噪:基于算法加持,智能降噪可以过滤用户通话时的周侧嘈杂音,更精准清晰地识别真正的用户声音,从而产生更有效的拟人互动。

  • 高拟人音色:同时支持 100+高拟人音色可灵活切换。

  • 智能意图识别:在人机对话过程中,AI 智能体能够有效识别用户的对话打断意图,同时能识别用户当前说话是否结束,从而有效规避 AI 抢话的情况。


所以,做一个能够与用户进行自然流畅沟通的 AI 智能体,是超拟人化的关键能力,也是阿里云 AI 实时互动的独到之处。

AI 实时互动的超拟人化,在客户端可以为人机交互带来真实沟通感,从而优化各类场景下的高质量体验。同时对企业端,其开放 AI 生态的重要能力,让企业的智能互动更具延展性。

正是依托阿里云强大的云+AI 底座,「AI 实时互动」可以提供一个开放的 AI 生态给到企业。通过默认预置阿里云 AI 能力,并与阿里云百炼平台深度联动,企业可以在编排工作流中引入百炼已有的模型;同时,企业也可以通过标准的 API 规范引入其自研的大模型;此外,还可以提供即插即用的三方 AI 组件插件,来拓展业务需要的其他 AI 能力。




四大类场景,全球化服务



基于阿里云「AI 实时互动」的全新推出,目前已经迅速在四大场景商业落地,并真切攻克行业普遍存在的痛点。

场景 1:智能客服

绝大多数行业都需要的客户服务环节,但传统的客户服务存在高人力成本、服务话术标准落地不足的问题。得益于 AI 技术,智能客服行业随之而升。

助力智能服务的质量升级和成本优化,AI 实时互动公有云方案,整合所在行业的模型和知识库,构建高拟真的客服服务从而极大降低行业的用人成本、提升服务效能,尤其承载超拟人的智能互动能力,打破以往人工智能理解能力的限制,营造了高质量的智能客服,对零售、电商等众多行业,起到服务加持的真实价值。

场景 2:AI 撮合助手/AI 虚拟助手

撮合助手通常是指在特定场景下,帮助促进双方或多方达成交易与合作的工具或服务。这类助手可以是人工智能程序、软件平台或实际的人工服务,其通过匹配需求、提供信息、协商沟通等方式,使得参与方能够更高效地完成撮合过程。

所以,该行业的核心是提高信息透明度、加速决策过程,而同时存在的痛点在于,双方往往受限于时间、通话并发等问题,难以建立有效连通。为了提升撮合平台的连通效率,AI 实时互动公有云方案,结合所在行业的模型与知识库,通过 AI 构建 7*24 小时的在线撮合服务。于是,在物流货运、金融交易、房产中介、在线招聘、二手平台等众多行业都能逐步建立更有效的双方资源配置,撮合精准度和效能直线提升。

场景 3:AI 心理咨询师

当下对社会心理健康的关注,加速心理咨询行业发展,而专业心理咨询师的数量呈现需求缺口。AI 咨询师也同样应运而生,不仅解决咨询师数量问题,还对个人隐私保护更有裨益。

于是,解决资源缺失,提升咨询效率,AI 实时互动公有云方案,基于 AI 大模型训练,打造满足平台数量的“超拟人心理咨询师”,提供 7*24 小时全天候咨询、满足定制化服务,输出辅助诊断和有效监测。

场景 4:AI 虚拟教师

在线教育行业之上,衍生了全新的 AI 直播小班课场景,也是教育领域的技术融合创新。它结合了人工智能与在线直播教学的优势,为学生提供更加个性化、灵活和高效的学习体验。同样解决了教师资源有限、服务用户有限的弊端。

在此之上,AI 实时互动公有云方案,整合教育行业模型、预置课程视频片段,结合 AI 实时响应能力,打造无时间和数量限制、高品质的小班课助力新型的教育模式发展。

这款 AI 音视频通话端到端解决方案,不仅在上述四类场景中陆续落地,也在更多行业中探索创新。然而,其不仅在场景维度上的适用性很强,在物理空间上的服务质量更有全球性保障。

「AI 实时互动」依托实时音视频 ARTC 产品体系,全球 3200+节点覆盖和 QOS 优化,用户可以与 AI 智能体进行全球范围的高可靠、低延时通话,网络延时低至 200ms这意味着,它可以提供高质量的全球化服务,满足众多场景下的全球性用户覆盖。



体验定制 专属 AI 智能体




阿里云「AI 实时互动」方案

已在 7 月 31 日正式上线

陆续发布

语音通话智能体(VoiceAgent)

数字人通话智能体(AvatarAgent)

探索数智化生产力的新思路

打造企业专属云上 AI 智能体

仅需 10 分钟


加入「钉钉咨询群」联系专人,体验Demo



阿里云视频云 「视频云技术」你最值得关注的音视频技术公众号,每周推送来自阿里云一线的实践技术文章,在这里与音视频领
评论
  • 智能汽车可替换LED前照灯控制运行的原理涉及多个方面,包括自适应前照灯系统(AFS)的工作原理、传感器的应用、步进电机的控制以及模糊控制策略等。当下时代的智能汽车灯光控制系统通过车载网关控制单元集中控制,表现特殊点的有特斯拉,仅通过前车身控制器,整个系统就包括了灯光旋转开关、车灯变光开关、左LED前照灯总成、右LED前照灯总成、转向柱电子控制单元、CAN数据总线接口、组合仪表控制单元、车载网关控制单元等器件。变光开关、转向开关和辅助操作系统一般连为一体,开关之间通过内部线束和转向柱装置连接为多,
    lauguo2013 2024-12-10 15:53 78浏览
  • 我的一台很多年前人家不要了的九十年代SONY台式组合音响,接手时只有CD功能不行了,因为不需要,也就没修,只使用收音机、磁带机和外接信号功能就够了。最近五年在外地,就断电闲置,没使用了。今年9月回到家里,就一个劲儿地忙着收拾家当,忙了一个多月,太多事啦!修了电气,清理了闲置不用了的电器和电子,就是一个劲儿地扔扔扔!几十年的“工匠式”收留收藏,只能断舍离,拆解不过来的了。一天,忽然感觉室内有股臭味,用鼻子的嗅觉功能朝着臭味重的方向寻找,觉得应该就是这台组合音响?怎么会呢?这无机物的东西不会腐臭吧?
    自做自受 2024-12-10 16:34 136浏览
  • 【萤火工场CEM5826-M11测评】OLED显示雷达数据本文结合之前关于串口打印雷达监测数据的研究,进一步扩展至 OLED 屏幕显示。该项目整体分为两部分: 一、框架显示; 二、数据采集与填充显示。为了减小 MCU 负担,采用 局部刷新 的方案。1. 显示框架所需库函数 Wire.h 、Adafruit_GFX.h 、Adafruit_SSD1306.h . 代码#include #include #include #include "logo_128x64.h"#include "logo_
    无垠的广袤 2024-12-10 14:03 69浏览
  • 天问Block和Mixly是两个不同的编程工具,分别在单片机开发和教育编程领域有各自的应用。以下是对它们的详细比较: 基本定义 天问Block:天问Block是一个基于区块链技术的数字身份验证和数据交换平台。它的目标是为用户提供一个安全、去中心化、可信任的数字身份验证和数据交换解决方案。 Mixly:Mixly是一款由北京师范大学教育学部创客教育实验室开发的图形化编程软件,旨在为初学者提供一个易于学习和使用的Arduino编程环境。 主要功能 天问Block:支持STC全系列8位单片机,32位
    丙丁先生 2024-12-11 13:15 45浏览
  • 近日,搭载紫光展锐W517芯片平台的INMO GO2由影目科技正式推出。作为全球首款专为商务场景设计的智能翻译眼镜,INMO GO2 以“快、准、稳”三大核心优势,突破传统翻译产品局限,为全球商务人士带来高效、自然、稳定的跨语言交流体验。 INMO GO2内置的W517芯片,是紫光展锐4G旗舰级智能穿戴平台,采用四核处理器,具有高性能、低功耗的优势,内置超微高集成技术,采用先进工艺,计算能力相比同档位竞品提升4倍,强大的性能提供更加多样化的应用场景。【视频见P盘链接】 依托“
    紫光展锐 2024-12-11 11:50 44浏览
  • 习学习笔记&记录学习学习笔记&记录学习学习笔记&记录学习学习笔记&记录学习笔记&记录学习习笔记&记学习学习笔记&记录学习学习笔记&记录学习习笔记&记录学习学习笔记&记录学习学习笔记记录学习学习笔记&记录学习学习笔记&记录学习学习笔记&记录学习学习笔记&记录学习学习笔记&记录学习习笔记&记录学习学习笔记&记录学习学习笔记&记录学习学习笔记&记录学习学习笔记&记录学习学习笔记&记录学习学习笔记&记录学习学习笔记&学习学习笔记&记录学习学习笔记&记录学习学习笔记&记录学习学习笔记&记录学习学习笔记&记
    youyeye 2024-12-10 16:13 105浏览
  • RK3506 是瑞芯微推出的MPU产品,芯片制程为22nm,定位于轻量级、低成本解决方案。该MPU具有低功耗、外设接口丰富、实时性高的特点,适合用多种工商业场景。本文将基于RK3506的设计特点,为大家分析其应用场景。RK3506核心板主要分为三个型号,各型号间的区别如下图:​图 1  RK3506核心板处理器型号场景1:显示HMIRK3506核心板显示接口支持RGB、MIPI、QSPI输出,且支持2D图形加速,轻松运行QT、LVGL等GUI,最快3S内开
    万象奥科 2024-12-11 15:42 65浏览
  • 全球知名半导体制造商ROHM Co., Ltd.(以下简称“罗姆”)宣布与Taiwan Semiconductor Manufacturing Company Limited(以下简称“台积公司”)就车载氮化镓功率器件的开发和量产事宜建立战略合作伙伴关系。通过该合作关系,双方将致力于将罗姆的氮化镓器件开发技术与台积公司业界先进的GaN-on-Silicon工艺技术优势结合起来,满足市场对高耐压和高频特性优异的功率元器件日益增长的需求。氮化镓功率器件目前主要被用于AC适配器和服务器电源等消费电子和
    电子资讯报 2024-12-10 17:09 84浏览
  • 概述 通过前面的研究学习,已经可以在CycloneVGX器件中成功实现完整的TDC(或者说完整的TDL,即延时线),测试结果也比较满足,解决了超大BIN尺寸以及大量0尺寸BIN的问题,但是还是存在一些之前系列器件还未遇到的问题,这些问题将在本文中进行详细描述介绍。 在五代Cyclone器件内部系统时钟受限的情况下,意味着大量逻辑资源将被浪费在于实现较大长度的TDL上面。是否可以找到方法可以对此前TDL的长度进行优化呢?本文还将探讨这个问题。TDC前段BIN颗粒堵塞问题分析 将延时链在逻辑中实现后
    coyoo 2024-12-10 13:28 101浏览
  • 一、SAE J1939协议概述SAE J1939协议是由美国汽车工程师协会(SAE,Society of Automotive Engineers)定义的一种用于重型车辆和工业设备中的通信协议,主要应用于车辆和设备之间的实时数据交换。J1939基于CAN(Controller Area Network)总线技术,使用29bit的扩展标识符和扩展数据帧,CAN通信速率为250Kbps,用于车载电子控制单元(ECU)之间的通信和控制。小北同学在之前也对J1939协议做过扫盲科普【科普系列】SAE J
    北汇信息 2024-12-11 15:45 68浏览
  • 时源芯微——RE超标整机定位与解决详细流程一、 初步测量与问题确认使用专业的电磁辐射测量设备,对整机的辐射发射进行精确测量。确认是否存在RE超标问题,并记录超标频段和幅度。二、电缆检查与处理若存在信号电缆:步骤一:拔掉所有信号电缆,仅保留电源线,再次测量整机的辐射发射。若测量合格:判定问题出在信号电缆上,可能是电缆的共模电流导致。逐一连接信号电缆,每次连接后测量,定位具体哪根电缆或接口导致超标。对问题电缆进行处理,如加共模扼流圈、滤波器,或优化电缆布局和屏蔽。重新连接所有电缆,再次测量
    时源芯微 2024-12-11 17:11 65浏览
我要评论
0
点击右上角,分享到朋友圈 我知道啦
请使用浏览器分享功能 我知道啦