除了制造环节会外包给foundry和封测厂之外,一个芯片设计公司需要做好芯片定义、设计(包含芯片、系统和软件)、寻找客户(渠道建设)几个环节。简单地说,就是要明确:做什么芯片?怎么做出来?怎么卖出去?无论拥有成熟品牌的大型公司,还是初创公司,同时做好上述三点都是一个很大的挑战。

芯片是一个产品,同时也是一个服务于商业客户的行业,AI芯片自然也不例外。一个芯片从无到有通常需要经过定义、设计、制造和流通几个重要环节,除了制造环节会外包给foundry和封测厂之外,一个芯片设计公司需要做好芯片定义、设计(包含芯片、系统和软件)、寻找客户(渠道建设)几个环节。简单地说,就是要明确:做什么芯片?怎么做出来?怎么卖出去?无论拥有成熟品牌的大型公司,还是初创公司,同时做好上述三点都是一个很大的挑战。

那么,在AI芯片的不同阶段(规划、设计、验证、流片、板卡/系统集成、应用方案)分别面临什么挑战?

  • 规划阶段。最大的挑战是如何明确市场定位,规划出最有竞争力的方向。对于AI芯片设计初创公司来说,在早期阶段就引入战略合作伙伴能更好地理解市场需求,确保开发的AI芯片符合市场需求。同时,在规划阶段就要软件和硬件协同开发,因为AI芯片设计在很大程度上是软件定义硬件。如果硬件对软件和应用需求不友好,单纯从性能指标上看起来可能很好,但却很难实现产品化。
  • 设计及验证阶段。这是整个芯片开发流程中非常核心的部分,也是非常考验工程团队研发能力的阶段。怎么按计划做出符合规划目标的AI芯片是最大的挑战。
  • 板卡系统集成。这是产品化的另外一个关键阶段,再好的芯片如果没有一个稳定可靠的硬件平台,也没有办法交付给客户使用。在保证稳定性及可靠性的前提下,实现最佳的性能和效率比是最主要的追求目标。面向云端AI的高性能芯片大都以加速卡的形式集成到服务器中,整体能耗和使用成本也是客户考虑的一个重要指标。
  • 应用方案。这是连接客户与研发团队的桥梁,要确保研发符合客户的使用习惯,让客户能够以最小的代价就可以导入到其系统设计中。

下面以面向视频处理应用的瀚博半导体为例,来看国内AI芯片初创公司是如何应对这些挑战的。

从算力高低的角度来看,AI芯片的应用领域依次为数据中心(云)、边缘网关或服务器(边)、终端设备(端)。瀚博开发的是面向云端AI推理的大芯片,主要面临以下三大挑战:

  1. 随着摩尔定律的放缓,综合利用各种架构优势的异构运算(heterogeneous computing, DSA架构)成为推动算力增长的新趋势, 但随之而来的是系统架构和软件的复杂性;
  2. 算力越高,通常芯片面积就越大,需要堆积的晶体管数量越多, 这对于达成最佳PPA(性能、功耗和面积)带来了额外的挑战;
  3. 芯片越大越复杂,开发周期、研发成本和制造成本都随之增高,如何精准地定位一个有足够大体量的应用市场是AI芯片公司在运营层面的挑战。

据瀚博半导体联合创始人兼CTO张磊介绍,其创始团队在GPU领域拥有非常丰富的经验,但公司并没有首选做GPU,而是选择通过DSA架构来做面向AI+视频市场的芯片,从而在PPA和成本上具有明显市场优势。同时,相比于很多公司临时招募组建的研发团队,瀚博的创始团队有着多年相互配合的默契,以及大芯片研发和量产的管理经验和实战经验。该公司的第一颗芯片开始测试8分钟即点亮,这是通过完美执行而应对以上三大挑战的一个最好佐证。

为什么选择AI芯片而不是GPGPU?

PC时代随着图形操作系统的出现,大量需要3D图形运算的工具软件和游戏对于浮点运算的要求急剧升高,传统的X86 CPU处理器并不擅长这类任务,于是诞生了更擅长浮点运算的GPU。在这类应用中,系统会把图形渲染等任务offload到GPU上去。随着神经网络研究和应用的发展,GPU中的浮点运算能力在这些领域的应用逐渐发展起来,英伟达敏感地抓住了市场机会,将其GPU在保留传统渲染能力的同时增加了对于通用计算和神经网络运算的能力,并称之为GPGPU。

英伟达的GPGPU是包含渲染以及神经网络(“NN”)运算的。这种架构在同时需要两个能力的应用上会有一定的优势,但很显然对于技术积累要求也非常高。目前一些AI芯片初创公司所自称的GPGPU架构是指没有渲染的NN运算,而有一些声称做GPU的公司则是狭义的渲染GPU,二者都不是通常英伟达所指的GPGPU。英伟达由于有长年渲染GPU的技术积累,同时基于先发优势通过CUDA积累了生态优势,因此选择了GPGPU路线。但是,其他公司在这条路线上与其正面竞争是胜算很小的,即使国际知名公司(像英特尔和AMD)在GPGPU市场与其竞争都有相当的难度。

然而,没有一个技术是完美的,由于GPGPU保留了大量神经网络运算所不需要的单元,在单纯的神经网络运算上并不是最高效的,因此谷歌基于特定域架构(DSA)为自己的特定应用做了TPU。DSA架构给其他芯片公司带来了希望,包括Intel、特斯拉等知名公司都开始在这条路线上发力。

芯片设计是一个国际化的产业,知识产权在其中扮演着很重要的角色。渲染GPU由于发展历史久远,专利壁垒较高,即使与之相关的不带渲染的GPGPU也容易踩雷。相反,DSA由于出现较新,国际大企业和创业公司在知识产权上的差距并不大。选择针对AI+视频市场来做DSA架构的AI芯片,这对瀚博来说也是最明智的选择,其研发团队在视频领域的经验和对于大芯片的驾驭能力也得到了充分发挥。

项目研发团队是如何分工协作的?

瀚博SV100研发团队成员主要来自AMD、Cisco、意法半导体、华为、高通和Microchip等公司,其核心团队都有超过十年的开发协作经验。具体来说,瀚博有架构/IP开发、芯片验证、SoC实现、硅后验证,以及软件5大部门。

架构/IP团队负责芯片的整体架构规划以及核心IP的设计开发,某种程度来说架构和IP直接决定了一个产品的成败;芯片验证团队负责IP以及SoC验证,确保功能和性能符合设计要求;SoC实现团队基于架构设计,将各种IP集成到SoC,并且以尽量小的面积和尽量低的功耗来实现最大的性能;硅后验证团队主要负责芯片的功能性能验证,以及验证板和系统板的开发,同时也负责芯片产品化的各个方面;软件团队负责固件、驱动和编译器等软件方面的开发,可以说硬件定义产品的“身体”,而软件赋予产品的“灵魂”。

国内AI芯片公司相比国际巨头有什么优势和劣势?

与大多数科技行业的企业一样,国内AI芯片公司的最大优势就是贴近市场和客户,近水楼台先得月。中国市场对于AI芯片的发展有如下几个优势:

  1. AI应用本身就是一个新兴市场,很多应用场景都是在摸索中成长的。国内企业在近20年的迅速发展中耳濡目染,对于新鲜事物的尝试意愿是很高的。
  2. 中国近年的数字化基础设施建设带来的红利,比如中国拥有世界上最大规模的宽带及4G/5G通信网络;中国的互联网企业迅速成长为全球巨头,这些都为AI应用创造了良好的发展土壤。
  3. 中国很多传统行业处在转型期,比如中国的工业升级是天然建立在数字化前提上的,这给AI带来了巨大的发展空间。
  4. 国家政策鼓励芯片创业,新基建和“东数西算”等重大工程都为AI芯片公司提供了坚强的后盾。

国内AI芯片企业的劣势在于技术和IP积累不足,具体体现在:软硬件生态、知识产权和人才等方面。

责编:Steve
本文为EET电子工程专辑原创文章,禁止转载。请尊重知识产权,违者本司保留追究责任的权利。
阅读全文,请先
您可能感兴趣
面对AI时代带来的差异化趋势、软件应用及开发时间长、软硬件协同难、高复杂度高成本等挑战,国产EDA仍需不断探索和创新。
通过机器学习技术,EDA工具可以获取更精确的模型来预测设计中存在的问题,如布线拥塞、信号干扰、热效应等,从而为用户提供更准确快速的指导,避免后期返工。
该小组汇集了国内外领先的芯片及IP、嵌入式开发工具、操作系统等厂商,形成强有力的组织,使命是通过一站式功能安全认证服务,帮助企业提升认证价值,满足IEC 61508、ISO 26262等国际功能安全认证标准,从而更高效地达成功能安全要求。
在ICCAD 2024主峰会上,中国半导体行业协会集成电路设计分会理事长魏少军教授带来“中国芯片设计业要自强不息”主题报告演讲,深入解读了过去一年中国IC设计业的发展机遇与挑战,权威分析中国IC设计业各环节的主要数据及其背后的意义。
近日,华为终端BG CEO何刚在和紫牛基金创始合伙人张泉灵的对话中表示,华为Mate 70系列每一颗芯片都有国产的能力。此外,日前在深圳宝安中学的一场讲座中,华为终端BG 董事长余承东也自豪地宣布Mate70实现了芯片的100%国产化。
常情况下,英特尔的CEO在65岁时退休,而现年63岁的基辛格突然被退休,让市场感到意外。为了确保平稳过渡,英特尔董事会立即着手寻找新的CEO人选……
目前,智能终端NFC功能的使用频率越来越高,面对新场景新需求,ITMA多家成员单位一起联合推动iTAP(智能无感接近式协议)标准化项目,预计25年上半年发布1.0标准,通过功能测试、兼容性测试,确保新技术产业应用。
中科院微电子所集成电路制造技术重点实验室刘明院士团队提出了一种基于记忆交叉阵列的符号知识表示解决方案,首次实验演示并验证了忆阻神经-模糊硬件系统在无监督、有监督和迁移学习任务中的应用……
C&K Switches EITS系列直角照明轻触开关提供表面贴装 PIP 端子和标准通孔配置,为电信、数据中心和专业音频/视频设备等广泛应用提供创新的多功能解决方案。
投身国产浪潮向上而行,英韧科技再获“中国芯”认可
投资界传奇人物沃伦·巴菲特,一位94岁的亿万富翁,最近公开了他的遗嘱。其中透露了一个惊人的决定:他计划将自己99.5%的巨额财富捐赠给慈善机构,而只将0.5%留给自己的子女。这引起了大众对于巴菲特家庭
来源:观察者网12月18日消息,自12月2日美国发布新一轮对华芯片出口禁令以来,不断有知情人士向外媒透露拜登政府在卸任前将采取的下一步动作。美国《纽约时报》12月16日报道称,根据知情人士以及该报查阅
12月18日,珠海京东方晶芯科技举行设备搬入仪式。插播:加入LED显示行业群,请加VX:hangjia188在10月31日,珠海京东方晶芯科技有限公司发布了Mini/Micro LED COB显示产品
对于华为来说,今年的重磅机型都已经发完了,而明年的机型已经在研发中,Pura 80就是期待很高的一款。有博主爆料称,华为Pura 80将会用上了豪威OV50K传感器,同时电池容量达到5600毫安时。至
万物互联的时代浪潮中,以OLED为代表的新型显示技术,已成为人机交互、智能联结的重要端口。维信诺作为中国OLED赛道的先行者和引领者,凭借自主创新,实现了我国OLED技术的自立自强,成为中国新型显示产
扫描关注一起学嵌入式,一起学习,一起成长在嵌入式开发软件中查找和消除潜在的错误是一项艰巨的任务。通常需要英勇的努力和昂贵的工具才能从观察到的崩溃,死机或其他计划外的运行时行为追溯到根本原因。在最坏的情
 “ AWS 的收入增长应该会继续加速。 ”作者 | RichardSaintvilus编译 | 华尔街大事件亚马逊公司( NASDAQ:AMZN ) 在当前水平上还有 38% 的上涨空间。这主要得益
点击蓝字 关注我们电网和可再生能源系统向着更智能、更高效的方向发展助力优化能源分配构建更加绿色和可靠的能源未来12 月 24 日 上午 9:30 - 11:302024 德州仪器新能源基础设施技术直播
亲爱的企业用户和开发者朋友们距离2024 RT-Thread开发者大会正式开幕仅剩最后3天!还没报名的小伙伴,抓紧报名噢,12月21日不见不散!大会时间与地点时间:2024年12月21日 9:30-1
上个月,亿万富翁埃隆·马斯克谈到了年轻一代的生育问题。他强调生育的紧迫性,认为无论面临何种困难,生育后代都是必要的,否则人类可能会在无声中走向消亡。他认为人们对于生育的担忧有些过头,担心经济压力等问题