海天瑞声:基础数据服务需求阶段性减缓多模态大模型将催生新需求

原创 科创板日报 2023-11-19 22:25

海天瑞声董事长贺琳在业绩会上表示,随着智能驾驶相关政策的推出以及单车成本的不断下降,智能驾驶的商业化进程将加速,数据处理需求将呈现指数级增长趋势。海天瑞声判断,未来大模型向多模态发展亦将产生更多新型数据需求。


记者 | 郭辉

“近年来数字经济已成为国家经济发展的核心动能和重要引擎,数据要素作为其中的核心支柱之一,也将迎来新的发展机遇。”在海天瑞声业绩会上,公司财务负责人、董事会秘书吕思遥表示,公司多年提供的训练数据集及服务作为数据要素的一部分,围绕国家战略,正在积极布局数据要素更多领域的业务,加大对数据要素服务模式和相关技术探索,将其作为公司未来收入增长的潜在支撑。
据海天瑞声近期发布的三季度财报,公司今年前三季度实现营收1.03亿元,同比下降38.25%;归母净利润-3211万元,同比下降272.40%。单季度来看,第三季度营收为2875万元,同比下降45.10%。
针对业绩较大幅度波动,吕思遥表示,亏损主要系报告期内,公司境外收入受境外部分客户阶段性裁员、业务方向调整,以及数据出境相关法规落地实施的阶段性影响,公司境外收入同比下降;同时,为配合整体战略发展及业务拓展目标,公司在营销体系建设、管理架构及激励体系升级方面持续加大投入,叠加新购置办公楼带来折旧费用同比增加,使得管理费用、销售费用大幅增长。
公司本月接受机构调研表示,境内业务方面,虽然宏观稳经济政策已初见成效,但国内仍面临复杂严峻的内外部环境考验,部分境内客户对集中性研发投入仍持谨慎态度,基础数据服务领域客户预算及需求释放出现阶段性减缓,叠加行业内竞争加剧,综合导致境内收入同比下滑。
海天瑞声表示,未来公司将在继续巩固传统基础数据业务的同时,通过持续发展智能驾驶、大模型、数据要素等新兴战略型业务,实现收入的稳步回升。

智能驾驶数据需求广阔

海天瑞声今年境内智能驾驶业务收入表现平稳,整体收入占比有所提升,大模型等新兴数据需求逐步释放,公司称将为下一步驶入良性发展轨道奠定一定基础。
在业绩会上,投资者十分关注未来智能驾驶的数据需求空间,以及海天瑞声是否具备竞争力,能否抓住市场机遇。
海天瑞声董事长贺琳表示,随着智能驾驶相关政策的推出以及单车成本的不断下降,智能驾驶的商业化进程将加速,数据处理需求将呈现指数级增长趋势。根据德勤报告,智能驾驶数据需求在2022-2027年将达到30%以上复合增长率,具有广阔的市场空间。
具体来看,智能驾驶数据业务的市场需求主要与三个要素相关:
1)车厂的车型及传感器丰富度。通常来说,不同车型、不同传感器会有不同的硬件配置方案,继而需要不同的数据解决方案,因此车型/传感器等硬件配置的多样性程度,将会直接影响所需数据解决方案的数量;
2)量产车数量。量产车的数量决定了整个训练数据需求基数的大小;
3)智能驾驶级别的逐渐提升。智能驾驶级别和渗透率的提升决定了数据处理场景的种类和体量。
“这三个要素对训练数据需求的影响,是相互叠加的。”贺琳如是称。
据贺琳介绍,智能驾驶数据领域的核心竞争力主要体现在三个方面,分别是平台能力、算法能力以及数据安全能力。
首先,平台能力是数据标注能力的基石。“平台功能点覆盖的丰富度,是评价平台水平的核心要素,目前同时具备2D标注、3D点云标注、2D-3D联合标注、4D标注的供应商比较有限,能以最快速度覆盖更多功能需求的数据服务商,将能更好掌握智能驾驶数据市场的主动权以及议价能力。”
第二个核心要素是算法能力。平台的智能化程度越高,对人的依赖程度越低,在提高平台生产效率的同时,可以大幅降低生产成本。
第三个要素是数据安全能力。在智能驾驶数据领域,由于其采集图像、视频可能涉及地理及个人隐私信息,为更好防范数据安全风险,国家相关法律法规要求,数据流转链条上各类企业必须做好充分的数据安全保障。“因此,未来不具备相关数据安全能力的供应商,将逐渐被市场淘汰。”

大模型多模态发展,将催生新型数据需求

今年十月,全国信息安全标准化技术委员会发布技术文件《生成式人工智能服务安全基本要求》征求意见稿。该份文件对语料安全、模型安全、安全措施、安全评估等方面内容,给出了生成式人工智能服务在安全方面的基本要求。
该份文件对海天瑞声的数据标注业务将有何影响?贺琳面对投资者提问表示,该文件将进一步提升数据合规要求,增加需求侧对高质量、专业化、合规数据的需求。“预计将会有更多大模型厂商释放更多的数据服务需求,给第三方数据服务商。”
海天瑞声董事长贺琳在业绩会上表示,公司已启动大模型标准化数据集产品的研发投入计划。据了解,该公司此前定增计划的核心内容之一,即为大模型数据集产品建设。“标准化数据集产品是公司区别于其他竞争对手的特色商业模式,标准化数据集产品由于其一次性投入、未来可重复销售的特点,对公司的营收、毛利起着重要作用。”
据介绍,数据集建成后,将提供可供大模型训练和评测的不少于10个品类的专业数据集,显著提升行业内面向大模型训练数据集的类别和质量,实现基于大模型通用能力和垂直领域数据的训练学习。
“随着更多大模型产品面向公众推出上线,以及不断进行版本迭代,未来的大模型相关数据需求会持续显著增长,这符合当AI进入大规模落地应用后对数据的需求才会规模性增长的规律。”
贺琳表示,预期该类增长将主要体现在预训练阶段对高质量、大规模的版权数据、公共/政务数据、多模态数据、垂直领域的实际场景数据等方面的需求,以及不断提升其交互精准度的强化学习阶段各类数据需求等。未来,随着大模型向更高级、更多维、更广泛垂向拓展,大模型数据需求将呈现快速增长趋势。
此外,海天瑞声判断,未来大模型向多模态发展亦将会产生更多新型数据需求。
大模型向多模态发展后,将会产生更多的例如文生图的多模态大模型,通过文字输入生成对应图片,这就需要机器理解文字语义的同时,将理解的关键词与图片的关键标签进行映射,通过对齐两种独立模态关键特征的方式,实现按指令的创作,以此完成学习训练过程。因此,当大模型向多模态能力维度拓展时,高质量多模态训练数据集的持续学习训练的重要性将更加凸显,多模态的发展,将推动数据服务行业进入更大的增量空间。




推荐阅读





科创板日报 国内首个专注科创板、创投及TMT等领域的新锐媒体,致力于打造领先、专业、权威的科创信息服务平台。
评论
  • 故障现象一辆2017款东风风神AX7车,搭载DFMA14T发动机,累计行驶里程约为13.7万km。该车冷起动后怠速运转正常,热机后怠速运转不稳,组合仪表上的发动机转速表指针上下轻微抖动。 故障诊断 用故障检测仪检测,发动机控制单元中无故障代码存储;读取发动机数据流,发现进气歧管绝对压力波动明显,有时能达到69 kPa,明显偏高,推断可能的原因有:进气系统漏气;进气歧管绝对压力传感器信号失真;发动机机械故障。首先从节气门处打烟雾,没有发现进气管周围有漏气的地方;接着拔下进气管上的两个真空
    虹科Pico汽车示波器 2025-01-08 16:51 84浏览
  • 本文介绍编译Android13 ROOT权限固件的方法,触觉智能RK3562开发板演示,搭载4核A53处理器,主频高达2.0GHz;内置独立1Tops算力NPU,可应用于物联网网关、平板电脑、智能家居、教育电子、工业显示与控制等行业。关闭selinux修改此文件("+"号为修改内容)device/rockchip/common/BoardConfig.mkBOARD_BOOT_HEADER_VERSION ?= 2BOARD_MKBOOTIMG_ARGS :=BOARD_PREBUILT_DTB
    Industio_触觉智能 2025-01-08 00:06 100浏览
  • 村田是目前全球量产硅电容的领先企业,其在2016年收购了法国IPDiA头部硅电容器公司,并于2023年6月宣布投资约100亿日元将硅电容产能提升两倍。以下内容主要来自村田官网信息整理,村田高密度硅电容器采用半导体MOS工艺开发,并使用3D结构来大幅增加电极表面,因此在给定的占位面积内增加了静电容量。村田的硅技术以嵌入非结晶基板的单片结构为基础(单层MIM和多层MIM—MIM是指金属 / 绝缘体/ 金属) 村田硅电容采用先进3D拓扑结构在100um内,使开发的有效静电容量面积相当于80个
    知白 2025-01-07 15:02 145浏览
  • 在智能家居领域中,Wi-Fi、蓝牙、Zigbee、Thread与Z-Wave等无线通信协议是构建短距物联局域网的关键手段,它们常在实际应用中交叉运用,以满足智能家居生态系统多样化的功能需求。然而,这些协议之间并未遵循统一的互通标准,缺乏直接的互操作性,在进行组网时需要引入额外的网关作为“翻译桥梁”,极大地增加了系统的复杂性。 同时,Apple HomeKit、SamSung SmartThings、Amazon Alexa、Google Home等主流智能家居平台为了提升市占率与消费者
    华普微HOPERF 2025-01-06 17:23 211浏览
  • 大模型的赋能是指利用大型机器学习模型(如深度学习模型)来增强或改进各种应用和服务。这种技术在许多领域都显示出了巨大的潜力,包括但不限于以下几个方面: 1. 企业服务:大模型可以用于构建智能客服系统、知识库问答系统等,提升企业的服务质量和运营效率。 2. 教育服务:在教育领域,大模型被应用于个性化学习、智能辅导、作业批改等,帮助教师减轻工作负担,提高教学质量。 3. 工业智能化:大模型有助于解决工业领域的复杂性和不确定性问题,尽管在认知能力方面尚未完全具备专家级的复杂决策能力。 4. 消费
    丙丁先生 2025-01-07 09:25 122浏览
  • 每日可见的315MHz和433MHz遥控模块,你能分清楚吗?众所周知,一套遥控设备主要由发射部分和接收部分组成,发射器可以将控制者的控制按键经过编码,调制到射频信号上面,然后经天线发射出无线信号。而接收器是将天线接收到的无线信号进行解码,从而得到与控制按键相对应的信号,然后再去控制相应的设备工作。当前,常见的遥控设备主要分为红外遥控与无线电遥控两大类,其主要区别为所采用的载波频率及其应用场景不一致。红外遥控设备所采用的射频信号频率一般为38kHz,通常应用在电视、投影仪等设备中;而无线电遥控设备
    华普微HOPERF 2025-01-06 15:29 172浏览
  • 「他明明跟我同梯进来,为什么就是升得比我快?」许多人都有这样的疑问:明明就战绩也不比隔壁同事差,升迁之路却比别人苦。其实,之间的差异就在于「领导力」。並非必须当管理者才需要「领导力」,而是散发领导力特质的人,才更容易被晓明。许多领导力和特质,都可以通过努力和学习获得,因此就算不是天生的领导者,也能成为一个具备领导魅力的人,进而被老板看见,向你伸出升迁的橘子枝。领导力是什么?领导力是一种能力或特质,甚至可以说是一种「影响力」。好的领导者通常具备影响和鼓励他人的能力,并导引他们朝着共同的目标和愿景前
    优思学院 2025-01-08 14:54 80浏览
  • By Toradex 秦海1). 简介嵌入式平台设备基于Yocto Linux 在开发后期量产前期,为了安全以及提高启动速度等考虑,希望将 ARM 处理器平台的 Debug Console 输出关闭,本文就基于 NXP i.MX8MP ARM 处理器平台来演示相关流程。 本文所示例的平台来自于 Toradex Verdin i.MX8MP 嵌入式平台。  2. 准备a). Verdin i.MX8MP ARM核心版配合Dahlia载板并
    hai.qin_651820742 2025-01-07 14:52 111浏览
  •  在全球能源结构加速向清洁、可再生方向转型的今天,风力发电作为一种绿色能源,已成为各国新能源发展的重要组成部分。然而,风力发电系统在复杂的环境中长时间运行,对系统的安全性、稳定性和抗干扰能力提出了极高要求。光耦(光电耦合器)作为一种电气隔离与信号传输器件,凭借其优秀的隔离保护性能和信号传输能力,已成为风力发电系统中不可或缺的关键组件。 风力发电系统对隔离与控制的需求风力发电系统中,包括发电机、变流器、变压器和控制系统等多个部分,通常工作在高压、大功率的环境中。光耦在这里扮演了
    晶台光耦 2025-01-08 16:03 75浏览
  • 根据环洋市场咨询(Global Info Research)项目团队最新调研,预计2030年全球无人机锂电池产值达到2457百万美元,2024-2030年期间年复合增长率CAGR为9.6%。 无人机锂电池是无人机动力系统中存储并释放能量的部分。无人机使用的动力电池,大多数是锂聚合物电池,相较其他电池,锂聚合物电池具有较高的能量密度,较长寿命,同时也具有良好的放电特性和安全性。 全球无人机锂电池核心厂商有宁德新能源科技、欣旺达、鹏辉能源、深圳格瑞普和EaglePicher等,前五大厂商占有全球
    GIRtina 2025-01-07 11:02 127浏览
我要评论
0
点击右上角,分享到朋友圈 我知道啦
请使用浏览器分享功能 我知道啦