香农伙伴|壁仞科技发布首款通用GPU芯片,创全球算力新纪录

香农芯创 2022-08-10 11:16




2022年8月9日,国产芯片迎来重大突破,香农芯创伙伴企业壁仞科技在上海发布首款通用GPU芯片BR100,创出全球算力纪录,16位浮点算力达到1000T以上、8位定点算力达到2000T以上,单芯片峰值算力达到PFLOPS级别。


香农芯创2020年8月投资了壁仞科技,坚定支持壁仞科技研发原创性的通用计算体系和提供智能计算领域一体化解决方案。


而此次BR100的正式发布,标志着中国企业第一次打破了此前一直由国际巨头保持的通用GPU全球算力纪录。



除了广受关注的BR100通用GPU芯片之外,壁仞科技还正式发布了自主原创架构——壁立仞,创造全球性能纪录的OAM服务器——海玄,以及OAM模组——壁砺100,PCIe板卡产品——壁砺104,以及自主研发的BIRENSUPA软件平台。

 

上海市闵行区委书记陈宇剑,闵行区委副书记、区长陈华文,上海市经济和信息化委员会一级巡视员傅新华,中国电子工业标准化技术协会理事长、中国工业和信息化部科技司原司长胡燕,上海临港经济发展(集团)有限公司党委书记、董事长袁国华,闵行区副区长李锐,临港浦江国际科技城党委书记、董事长施决兵以及闵行区、浦江镇相关部门领导;平安科技董事长兼CEO黄宇翔,浪潮信息副总裁、AI&HPC产品线总经理刘军,百度飞桨训练芯片适配技术负责人李琦等产业界嘉宾;壁仞科技的投资机构代表和新闻媒体代表,共同见证壁仞科技首款通用GPU芯片正式发布。

 

发布会现场,各级领导向壁仞科技创始人、董事长、CEO张文积极带领的团队在疫情期间,克服困难,持续创新,自主研发原创架构,成功推出世界领先的超大算力芯片实现0到1的突破,表示衷心的祝贺,希望壁仞科技持续增强自主创新能力、加大核心技术攻坚力度,推动集成电路产业创新发展。


壁仞科技BR100正式亮相


壁仞科技创始人、董事长、CEO张文正式发布首款通用GPU芯片产品——BR100,这款芯片创出全球算力纪录,峰值算力达到国际厂商在售旗舰产品3倍以上,创下国内互连带宽纪录,还是国内率先采用Chiplet技术、率先采用新一代主机接口PCIe 5.0、率先支持CXL互连协议的通用GPU芯片


张文介绍,BR100的正式发布,标志着全球通用GPU算力纪录第一次由一家中国企业创造,中国的通用GPU芯片正式迈入“每秒千万亿次计算”新时代。



BR100之所以能够实现国际领先的算力,最底层的支撑来源于自主原创的芯片架构。张文说,三年前,在武夷山“壁立万仞”巨石下,笃定地创办了壁仞科技;三年后,用“壁立仞”三字,正式为壁仞科技的芯片原创架构命名。


发布会上,壁仞科技联合创始人、CTO洪洲,详细介绍了原创架构——壁立仞。洪洲说,壁立仞架构以数据流为中心,对数据流进行深度的优化,通过六大技术特性,比较完整地解决了数据搬移的瓶颈和并行度不足的问题,使得BR100芯片在给定的工艺下实现了性能和能效的跨越式进步。


洪洲介绍,BR100采用了Chiplet设计理念,让芯片总面积可以突破光罩尺寸对单芯片面积的限制,集成更多的算力和通用性逻辑;此外,通过缩小单个计算芯粒的面积,还可以同时提升产能与良率,进而极大地降低硅片的成本,并支持更灵活的产品策略。


壁仞科技BR104正式亮相


洪洲还现场发布了壁仞科技BR100系列的另一款产品BR104,该款芯片同样基于壁立仞架构,拥有1个计算芯粒,性能约为BR100的一半,同样超越了国际厂商的在售旗舰产品。“Chiplet设计让我们可以通过一次流片,同时得到两种芯片,大大加快了迭代速度,同时覆盖不同层级的市场。”洪洲说。


发布会上,壁仞科技联合创始人、总裁徐凌杰和浪潮信息副总裁、AI&HPC产品线总经理刘军,共同揭幕OAM服务器——海玄。徐凌杰介绍,该服务器可以提供高达8PFLOPS(8000万亿次每秒)的浮点峰值算力,超过了此前的任何一台8卡加速计算设备的能力。


壁仞科技与浪潮共同发布海玄OAM服务器


与此同时,壁仞科技还发布了基于BR104的主流产品壁砺104,基于标准PCIe形态,功耗控制在300W以内,其形态较为紧凑,部署广泛、适应性强,可以适配多种2-4U的服务器,与客户现有的基础设施做到高度的兼容。


徐凌杰介绍,从芯片到板卡模组到服务器,以壁砺100和壁砺104为底座,壁仞科技形成了一条完整的数据中心加速计算产品线。壁砺104已经对部分用户开放了邀测,即将量产出货;海玄OAM服务器目前正在进行紧锣密鼓的内部测试,预计今年第四季度开放邀测。



壁仞科技除了研发大算力芯片之外,还着力于以客户需求为出发点,提供软硬一体的解决方案,帮助客户实现价值最大化。


发布会上,壁仞科技联席CEO李新荣详细介绍了壁仞科技自主研发的BIRENSUPA软件平台,该平台构建在BR100系列产品的底层硬件之上,由驱动层、编程平台、框架层、应用解决方案构成,支持各类应用场景。BIRENSUPA编程平台位于软件栈的中心位置,包括BIRENSUPA编程模型、加速库、工具链、编译器等组件。开发者可以通过这些组件,释放BR100系列硬件的强大算力,并开发各种应用。


壁仞科技加入飞桨硬件生态共创计划


BIRENSUPA平台支持主流的深度学习框架,发布会上,壁仞科技联席CEO李新荣与百度飞桨训练芯片适配技术负责人李琦共同宣布,壁仞科技加入由百度飞桨发起的硬件生态共创计划。


在发布首款通用GPU芯片创出全球算力纪录的同时,壁仞科技已经在积极布局商业化落地,推动数字经济社会发展。


发布会上,平安科技董事长兼CEO黄宇翔表示,平安科技将以平安云为基础,结合壁仞科技产品共同打造高端通用智能的算力平台,针对不同的用户场景,推出有市场竞争力的产品和解决方案。壁仞科技还将依托国产大算力芯片为平安提供高效训练、低成本推理、综合应用硬件等解决方案,并且对平安在AI视觉、语音人机交互底层算法等业务场景进行软硬件专项适配。


“相信此次的芯片发布能为整个计算机体系提供高算力支撑,有利于进一步强化平安科技在金融科技、医疗科技领域的拓展,推进平安集团内外部业务场景中人工智能技术应用的提升,以最大程度实现自主可控,技术创新与降本增效。”黄宇翔董事长说。


中国移动研究院人工智能与智慧运营中心副总经理金镝表示,智能计算是整个算力网络发展中的先锋力量,希望壁仞科技的新产品与中国移动的算力网络整体的发展深度适配,同时也希望壁仞科技的产品和中国移动九天人工智能平台有更好的合作,为开发者和上层应用的使用者提供更加丰富的算法,更加强劲的算力和更加优秀的运营成本。


生态建立一直是壁仞科技发展战略的重中之重,为了更好地服务全球开发者,壁仞科技开发者云也已经正式上线,官网上已开放邀测。壁仞科技希望通过社会各界开发者的共同努力,形成聚沙成塔的力量,共同推动中国半导体技术的发展,真正做到让更多人从技术发展中受益。



要推动技术生态的成长,汇聚了世界尖端技术、顶尖人才、前沿科技的高校不可或缺。


发布会上,清华大学电子工程系长聘教授、系主任汪玉表示,算力对于数字世界、物理世界的融合和共同发展,具有巨大的作用。建立国产的GPGPU和AI芯片的生态非常重要。“如果能建立一个相对统一的生态,让更多的用户进行这个编程和应用,对芯片的厂商,将是一个重大的利好。”


成立近三年来,壁仞科技已与数十所世界顶尖高校建立合作关系,在技术共同研究、人才共同培养、科研成果转化等方面取得了丰硕成果。各高校实验室在壁仞科技的平台上进行了包括医疗影像、分子动力学、电磁仿真等领域的应用研究。



进化不止,计算不止,人类社会对算力的追求永无止境。


香农芯创将一如既往支持壁仞科技攀登算力高峰,实现“智绘全球”的远大愿景。


关于壁仞科技

壁仞科技创立于2019年,致力于研发原创性的通用计算体系,建立高效的软硬件平台,同时在智能计算领域提供一体化的解决方案。从发展路径上,壁仞科技将首先聚焦云端通用智能计算,逐步在人工智能训练和推理、图形渲染等多个领域赶超现有解决方案,实现国产高端通用智能计算芯片的突破。截至目前,壁仞科技已完成B轮融资,总融资额超50亿元人民币,屡屡刷新半导体领域融资速度及融资规模纪录,成为成长势头最为迅猛的“独角兽”企业。首款国产高端通用GPU芯片已正式发布,创出全球算力新纪录。



评论
  • 11-29学习笔记11-29学习笔记习学习笔记&记录学习学习笔记&记录学习学习笔记&记录学习学习笔记&记录学习笔记&记录学习习笔记&记学习学习笔记&记录学习学习笔记&记录学习习笔记&记录学习学习笔记&记录学习学习笔记记录学习学习笔记&记录学习学习笔记&记录学习学习笔记&记录学习学习笔记&记录学习学习笔记&记录学习习笔记&记录学习学习笔记&记录学习学习笔记&记录学习学习笔记&记录学习学习笔记&记录学习学习笔记&记录学习学习笔记&记录学习学习笔记&学习学习笔记&记录学习学习笔记&记录学习学习笔记&记
    youyeye 2024-12-02 23:58 71浏览
  • RDDI-DAP错误通常与调试接口相关,特别是在使用CMSIS-DAP协议进行嵌入式系统开发时。以下是一些可能的原因和解决方法: 1. 硬件连接问题:     检查调试器(如ST-Link)与目标板之间的连接是否牢固。     确保所有必要的引脚都已正确连接,没有松动或短路。 2. 电源问题:     确保目标板和调试器都有足够的电源供应。     检查电源电压是否符合目标板的规格要求。 3. 固件问题: &n
    丙丁先生 2024-12-01 17:37 100浏览
  • 概述 说明(三)探讨的是比较器一般带有滞回(Hysteresis)功能,为了解决输入信号转换速率不够的问题。前文还提到,即便使能滞回(Hysteresis)功能,还是无法解决SiPM读出测试系统需要解决的问题。本文在说明(三)的基础上,继续探讨为SiPM读出测试系统寻求合适的模拟脉冲检出方案。前四代SiPM使用的高速比较器指标缺陷 由于前端模拟信号属于典型的指数脉冲,所以下降沿转换速率(Slew Rate)过慢,导致比较器检出出现不必要的问题。尽管比较器可以使能滞回(Hysteresis)模块功
    coyoo 2024-12-03 12:20 108浏览
  • 最近几年,新能源汽车愈发受到消费者的青睐,其销量也是一路走高。据中汽协公布的数据显示,2024年10月,新能源汽车产销分别完成146.3万辆和143万辆,同比分别增长48%和49.6%。而结合各家新能源车企所公布的销量数据来看,比亚迪再度夺得了销冠宝座,其10月新能源汽车销量达到了502657辆,同比增长66.53%。众所周知,比亚迪是新能源汽车领域的重要参与者,其一举一动向来为外界所关注。日前,比亚迪汽车旗下品牌方程豹汽车推出了新车方程豹豹8,该款车型一上市就迅速吸引了消费者的目光,成为SUV
    刘旷 2024-12-02 09:32 119浏览
  •         温度传感器的精度受哪些因素影响,要先看所用的温度传感器输出哪种信号,不同信号输出的温度传感器影响精度的因素也不同。        现在常用的温度传感器输出信号有以下几种:电阻信号、电流信号、电压信号、数字信号等。以输出电阻信号的温度传感器为例,还细分为正温度系数温度传感器和负温度系数温度传感器,常用的铂电阻PT100/1000温度传感器就是正温度系数,就是说随着温度的升高,输出的电阻值会增大。对于输出
    锦正茂科技 2024-12-03 11:50 106浏览
  • 《高速PCB设计经验规则应用实践》+PCB绘制学习与验证读书首先看目录,我感兴趣的是这一节;作者在书中列举了一条经典规则,然后进行详细分析,通过公式推导图表列举说明了传统的这一规则是受到电容加工特点影响的,在使用了MLCC陶瓷电容后这一条规则已经不再实用了。图书还列举了高速PCB设计需要的专业工具和仿真软件,当然由于篇幅所限,只是介绍了一点点设计步骤;我最感兴趣的部分还是元件布局的经验规则,在这里列举如下:在这里,演示一下,我根据书本知识进行电机驱动的布局:这也算知行合一吧。对于布局书中有一句:
    wuyu2009 2024-11-30 20:30 122浏览
  • 戴上XR眼镜去“追龙”是种什么体验?2024年11月30日,由上海自然博物馆(上海科技馆分馆)与三湘印象联合出品、三湘印象旗下观印象艺术发展有限公司(下简称“观印象”)承制的《又见恐龙》XR嘉年华在上海自然博物馆重磅开幕。该体验项目将于12月1日正式对公众开放,持续至2025年3月30日。双向奔赴,恐龙IP撞上元宇宙不久前,上海市经济和信息化委员会等部门联合印发了《上海市超高清视听产业发展行动方案》,特别提到“支持博物馆、主题乐园等场所推动超高清视听技术应用,丰富线下文旅消费体验”。作为上海自然
    电子与消费 2024-11-30 22:03 98浏览
  • TOF多区传感器: ND06   ND06是一款微型多区高集成度ToF测距传感器,其支持24个区域(6 x 4)同步测距,测距范围远达5m,具有测距范围广、精度高、测距稳定等特点。适用于投影仪的无感自动对焦和梯形校正、AIoT、手势识别、智能面板和智能灯具等多种场景。                 如果用ND06进行手势识别,只需要经过三个步骤: 第一步&
    esad0 2024-12-04 11:20 50浏览
  • 光伏逆变器是一种高效的能量转换设备,它能够将光伏太阳能板(PV)产生的不稳定的直流电压转换成与市电频率同步的交流电。这种转换后的电能不仅可以回馈至商用输电网络,还能供独立电网系统使用。光伏逆变器在商业光伏储能电站和家庭独立储能系统等应用领域中得到了广泛的应用。光耦合器,以其高速信号传输、出色的共模抑制比以及单向信号传输和光电隔离的特性,在光伏逆变器中扮演着至关重要的角色。它确保了系统的安全隔离、干扰的有效隔离以及通信信号的精准传输。光耦合器的使用不仅提高了系统的稳定性和安全性,而且由于其低功耗的
    晶台光耦 2024-12-02 10:40 120浏览
  • 艾迈斯欧司朗全新“样片申请”小程序,逾160种LED、传感器、多芯片组合等产品样片一触即达。轻松3步完成申请,境内免费包邮到家!本期热荐性能显著提升的OSLON® Optimal,GF CSSRML.24ams OSRAM 基于最新芯片技术推出全新LED产品OSLON® Optimal系列,实现了显著的性能升级。该系列提供五种不同颜色的光源选项,包括Hyper Red(660 nm,PDN)、Red(640 nm)、Deep Blue(450 nm,PDN)、Far Red(730 nm)及Ho
    艾迈斯欧司朗 2024-11-29 16:55 174浏览
  • 当前,智能汽车产业迎来重大变局,随着人工智能、5G、大数据等新一代信息技术的迅猛发展,智能网联汽车正呈现强劲发展势头。11月26日,在2024紫光展锐全球合作伙伴大会汽车电子生态论坛上,紫光展锐与上汽海外出行联合发布搭载紫光展锐A7870的上汽海外MG量产车型,并发布A7710系列UWB数字钥匙解决方案平台,可应用于数字钥匙、活体检测、脚踢雷达、自动泊车等多种智能汽车场景。 联合发布量产车型,推动汽车智能化出海紫光展锐与上汽海外出行达成战略合作,联合发布搭载紫光展锐A7870的量产车型
    紫光展锐 2024-12-03 11:38 101浏览
  • 学习学习笔记&记录学习学习笔记&记录学习学习笔记&记录学习学习笔记&记录学习学习笔记&记录学习笔记&记录学习习笔记&记学习学习笔记&记录学习学习笔记&记录学习习笔记&记录学习学习笔记&记录学习学习笔记记录学习学习笔记&记录学习学习笔记&记录学习学习笔记&记录学习学习笔记&记录学习学习笔记&记录学习习笔记&记录学习学习笔记&记录学习学习笔记&记录学习学习笔记&记录学习学习笔记&记录学习学习笔记&记录学习学习笔记&记录学习学习笔记&学习学习笔记&记录学习学习笔记&记录学习学习笔记&记录学习学习笔记&
    youyeye 2024-11-30 14:30 78浏览
  • 作为优秀工程师的你,已身经百战、阅板无数!请先醒醒,新的项目来了,这是一个既要、又要、还要的产品需求,ARM核心板中一个处理器怎么能实现这么丰富的外围接口?踌躇之际,你偶阅此文。于是,“潘多拉”的魔盒打开了!没错,USB资源就是你打开新世界得钥匙,它能做哪些扩展呢?1.1  USB扩网口通用ARM处理器大多带两路网口,如果项目中有多路网路接口的需求,一般会选择在主板外部加交换机/路由器。当然,出于成本考虑,也可以将Switch芯片集成到ARM核心板或底板上,如KSZ9897、
    万象奥科 2024-12-03 10:24 68浏览
  • 遇到部分串口工具不支持1500000波特率,这时候就需要进行修改,本文以触觉智能RK3562开发板修改系统波特率为115200为例,介绍瑞芯微方案主板Linux修改系统串口波特率教程。温馨提示:瑞芯微方案主板/开发板串口波特率只支持115200或1500000。修改Loader打印波特率查看对应芯片的MINIALL.ini确定要修改的bin文件#查看对应芯片的MINIALL.ini cat rkbin/RKBOOT/RK3562MINIALL.ini修改uart baudrate参数修改以下目
    Industio_触觉智能 2024-12-03 11:28 84浏览
我要评论
0
点击右上角,分享到朋友圈 我知道啦
请使用浏览器分享功能 我知道啦