阿里公布首款AI芯片含光800最新进展：三大AI应用中性能显著提升-电子工程专辑

 阿里首款AI芯片含光800最新进展到底怎样？在AI应用中的性能如何？如何购买含光800？阿里落地的AI应用会有哪些？

2019年杭州云栖大会上，阿里巴巴集团首席技术官兼阿里云智能总裁张建锋简短的介绍了阿里首款AI芯片含光800，这款当时最强AI推理芯片的一发布就引发了巨大关注，可谓高调亮相。今年的阿里线上云栖有一个芯片设计发展现状与未来的论坛，阿里云异构计算产品研发总监龙欣分享了含光800推出近一年后的最新进展。

他表示：“含光800 NPU实例已经正式对外服务，不需要白名单就可以在阿里云实例上购买，实例名称是ebman1.24xlarge，最多支持8核NPU和96核vCPU，384G内存，网络带宽最高达到30Gbit/s，主要面向数据中心的CNN类型模型推理加速，业务包括城市大脑，图像视频审核，拍立淘等。”

更引人关注的是含光800在具体应用中的表现。

含光800未对外发售，性能通过阿里云输出

科技巨头自研芯片是因为有大量数据，在内部的AI需求推动下，希望通过自研芯片来提升效率和性价比。周五的线上分享中，龙欣也表示，阿里巴巴内部有广阔的AI应用，包括电商应用、视觉应用、语音交互、自然语言理解、机器翻译等。

一个典型的例子就是拍立淘，两千多万的日活用户在使用这项功能的时候，要透过一张图片，在4亿多的商品中搜索，在30多亿张图片多库中进行匹配，根据用户的使用习惯进行个性化推荐，这就需要很强的AI能力。

阿里云异构计算产品研发总监龙欣

因此，阿里希望通过自研的含光800从硬件到软件的方案提升性价比。做个简单的回顾，含光800在硬件方面有三个方面的特色，包括：

深度优化CNN及视觉类算法

加速卷积和矩阵乘，支持反卷积、孔洞卷积、3D卷积、插值、ROI等
针对 ResNet-50、SSD/DSSD、 Faster-RCNN、Mask-RCNN、DeepLab等模型优化

高能效、低延时

高密度的计算与存储，极大减少I/O需求
软硬协同支持权重的稀疏压缩，计算的量化压缩

指令集支持可编程模型扩展

除INT8/INT16量化加速外，也覆盖FP16/BFP16的向量计算除直接加速各种ReLu、 Sigmoid、Tanh等，也可支持未来新型激活函数

也就是说，含光800的硬件特别针对CNN算法模型进行设计，但也保持一定的灵活性，再匹配全栈的软件支持在特定应用和算法中实现高性价比。去年张建锋发布含光800时说，“在业界标准的ResNet-50测试中，含光800推理性能达到78563 IPS，比目前业界最好的AI芯片性能高4倍；能效比500 IPS/W，是第二名的3.3倍。”

不过龙欣在昨天的分享中并没有提及含光800的峰值性能，而是强调其可用性。他表示，“含光800作为并没有在公开市场发售的芯片，通过阿里云输出。”

为了让含光800能够开箱即用，阿里云让购买实例的用户可以自动安装NPU驱动和SDK，系统方面支持公共镜像CentOS 7.6/7.7和Ubuntu 16.04，还预装主流深度学习框架，提供TensorFlow、MXNet示范教程。

龙欣强调，含光800的应用主要是在数据中心和大型端上，以CNN类模型推理加速为主，可扩展到其他DNN模型中。目前在具体的应用中相比GPU有4-11倍性能提升。

含光800在三大AI应用中4-11倍的性能提升

去年含光800发布时给出的数据是，在城市大脑中实时处理杭州主城区交通视频，需要40颗传统GPU，延时为300ms，使用含光800仅需4颗，延时降至150ms。拍立淘商品库每天新增10亿商品图片，使用传统GPU算力识别需要1小时，使用含光800后可缩减至5分钟。

昨天的分享中，龙欣给出的最新数据是，在行人检测应用中，4核含光800克支持100路视频，比主流GPU 25路的推理性能提升4倍。在车辆检测中，同样是4核含光800，可以支持85路视频，比主流GPU支持10路推理性能提升了8.5倍。

在直播、短视频、商品信息流等内容识别应用中的ResNet50 V2模型中，含光800（4核）的帧率可以达到20000 FPS，比主流推理GPU的1800 FPS性能提升11倍，性能加速比11倍。在Inception V4模型中，含光800（4核）的处理帧率达到5000 FPS，比主流推理GPU的460FPS性能加速比高10.8倍。

还有，在直播、点播、短视频等视频质量增强中。4核含光800的直播视频增强性能为500 FPS，对比主流推理GPU的50 FPS，性能加速比是10倍。在点播HDR中，4核含光800多性能是66 FPS。龙欣说：“点播HDR需要用到性能比较强的训练GPU，比如英伟达A100，但即便如此其性能智能达到10 FPS，我们可以实现6.6倍的性能加速比。”

至于在语音交互、自然语言理解等语言方面的应用实例优势，龙欣并未在今年的云栖上给出数据。

阅读全文，请先

本文为EET电子工程专辑原创文章，禁止转载。请尊重知识产权，违者本司保留追究责任的权利。

处理器/DSP 人工智能

返回列表

上一篇： AMD高级副总裁透露，已获得对华为供货许可证 下一篇： 高通骁龙875与三星Exynos 1000硬刚：同为5nm、八核心设计

Apple AirPods 3发布日期、价格推测，外观、功能全新升级值得期待 AirPods Pro的升级版——AirPods Pro苹果明年才会推出，大家可以把关注点集中放到AirPods 3身上了。如果不出意外，苹果这款真无线耳机新品将会在今年Q3季度登场，与新的16英寸、14英寸版MacBook Pro等一同亮相。
小米新系统MIUI13新消息:锁定发布时间、支持更新机型名单列表前几天MIUI 12.5完成了与3年前的小米8适配，进一步完成了小米大部分机型的完整推送，而这也意味着离MIUI 13又更近了一部，并且据媒体的曝光消息称，新系统或将在下半年和MIX新机一同亮相。
微软新版Surface Laptop曝光：酷睿i5处理器，价格3383元微软正在开发的新版Surface Laptop代号为Sparti，它采用了12.5英寸PixelSense显示屏，搭载英特尔酷睿i5处理器，配备4GB内存+64GB存储，起售价约为500美元（约合人民币3383元）。
高通骁龙870 vs 联发科天玑7000，跑分大比拼联发科对其系列芯片改名以来，引来业界的关注，上周在发布天玑9000的同时发布了次旗舰芯片天玑7000，与之对标的是高通骁龙的870，那么两者的性能参数和跑分对比如何呢？
SID 2021:三星卷轴屏、可折叠屏幕、屏下摄像头技术三星作为安卓机皇的代表，在硬件上一直优于国内其他安卓品牌，尤其是屏幕等组件。毕竟三星所有的组件都可以从自己的分支机构购买，所以屏幕的质量自然不得而知！奇怪的是，三星本身引领的曲面屏浪潮现在也在一点一点的扁平化，甚至出现了近乎扁平化的Note20系列。即使是曲面屏幕，过渡曲率也已经接近当年的2.5D玻璃。国产手机厂商过分追逐大曲率瀑布屏是不是很讽刺？
麒麟绝版?华为官网:Mate 40 Pro 4G版麒麟9000处理器（上市时间过去的一年华为命运非常坎坷，芯片断供，麒麟绝版，毕竟没有哪个企业能接受命脉被你控制了！华为在2021年将发布新款4G版的旗舰手机，或许现在对于华为来说，只有度过难关，生存下去，华为才有机会以后回归主流市场，或者发展得更好。
华为鸿蒙OS 2.0系统开源发布后，外国科技圈、媒体、网友热烈讨论和华为已是世界无人不晓了，一直备受全球期待的华为鸿蒙OS 2.0，它将影响那些行业，那些领域、技术变化？除了鸿蒙OS 2.0，华为还带来了EMUI 11和HMS生态的新进展，信息丰富。强链接能力、更快，、传输更安全，这是鸿蒙OS 2.0升级后最重要的变化。
苹果iPhone 13 A15芯片下月量产,2021新机芯片、售价、上市时间锁 iPhone 13或是真13香？A15芯片仍必须配备高通公司的5G基带才能支持5G网络。型号是X60 5G。苹果自己开发的5G基带可能需要等到2023年，也就是iPhone 15代。趁着销售业绩再创新高，苹果也没有懈怠，继续为苹果13的推出做着努力。
面临前景恶化，日企索尼、铠侠已向美政府申请供货华为自9月15日美国对华为的半导体出口禁令正式生效后，索尼公司和铠侠公司已停止向华为供货。但华为是这两家公司的关键客户，如果得不到美国的许可，索尼和铠侠都将面临收益前景恶化的风险。
十三香价格更高?iPhone13系列为什么未发布上市将涨价近期芯片价格的不断上涨也是导致苹果可能会上调iPhone 13系列价格的重要原因。尤其是已经有多家IC芯片企业收到了台积电的涨价通知，而台积电同时也为苹果代工处理器芯片。

Omdia ：2024年生成式AI软件市场将增长124% 许多拥有大型语言模型（LLM）的供应商的收入运行率表明，2024 年的收入增长将达到三位数……
IDC首测8款最热门移动端大模型，3款获好评本次报告的测评涵盖了市面上最热门的八个Chatbot App：kimi智能助手、豆包、海螺AI、天工、通义、文心一言、讯飞星火以及智谱清言（按照公司拼音首字母顺序排列）。
Imagination GPU为边缘智能提供高效率的加速在“2024奕斯伟计算开发者伙伴大会”上，来自Imagination英国总部的专家发表了主题为《用RISC-V CPU + PowerVR GPU迎接边缘生成式AI的到来》的演讲。
面向AI的下一代以太网技术随着AI应用的广泛普及和数据流量的迅猛增长，传统以太网技术在延迟、带宽、拥塞控制和高性能可扩展方面天然局限，导致其难以应对AI网络的复杂需求。
智能手机疲软，但超薄柔性玻璃出货量势头正猛可折叠盖板玻璃必须符合以下所有标准：透明、可折叠、坚固、平整和轻薄，这些基本要素缺一不可。
全球折叠屏手机快速增长，中国品牌压制三星 • 得益于西欧、关键亚洲市场和拉丁美洲市场的增长，以及中国品牌的持续领先，全球折叠屏手机出货量在2024年第二季度同比增长了48%。 • 荣耀凭借其在西欧特别强劲的表现，成为最大的贡献者，成为该地区排名第一的品牌。 • 摩托罗拉的Razr 40系列在北美和拉丁美洲表现良好，为其手机厂商的出货量贡献了三位数的同比增长。 • 我们预计，头部中国手机品牌厂商的不断增加将至少在短期内抑制三星Z6系列在第三季度的发布。
AI网络物理层底座：大算力芯片先进封装技术 AI技术的发展极大地推动了对先进封装技术的需求，在高密度，高速度，高带宽这“三高”方面提出了严苛的要求。
智能手表OLED面板超 60%中国制造智能手表在新冠肺炎疫情后获得了越发广泛的关注，其功能包括语音、健康检查、运动和活动追踪、GPS、通信和个人数据监控。全球智能手表显示面板的出货量已从2022年的2.59亿片增长到2023年的3.51亿片。到 2024年，Omdia预测智能手表显示面板的出货量将达到3.59亿片，其中TFT LCD占63%，OLED占37%。
无处不在的Arm软硬件生态赋能开发者AI创新随着计算变得愈发复杂，计算效率的重要性更胜以往。
荣耀拿下欧洲横折手机榜第一既然可以保留几乎相同的旧款手机，或者以更低的价格购买旧款手机，为什么要购买最新款的智能手机呢？但变化已经到来，智能手机品牌厂商正带着其最前沿的创新技术重返欧洲市场……

热门评论
最新评论

换一换

阿里公布首款AI芯片含光800最新进展：三大AI应用中性能显著提升

杂志声明