今年WAIC最热门的当然就是生成式AI了,毕竟ChatGPT在过去这些时间那么火,主要的大算力AI芯片厂商都在WAIC上展示他们的生成式AI成果...

今年WAIC(世界人工智能大会)参展的大部分有大算力资本的企业,都在做生成式AI(或AIGC)的展示,其中也包括燧原科技。其实燧原会在生成式AI上发力,在我们看来是很顺其自然的。毕竟其AI芯片原本就着力于大算力——覆盖大规模训练与推理,自然是要在生成式AI的时代发光发热的。

今年3月,燧原也宣布企业战略升级,要“全面打造AIGC时代的基础设施”——LLM的爆发从技术和市场两方面都为AI行业指明了新的方向。顺着这个思路,我们一起来看看今年燧原在WAIC上都展示了哪些新货。

▲ 芯片、板卡和系统层面,燧原在本届WAIC上没有做更新。关注燧原科技的读者对于这些产品应该不会陌生:上面这两颗,分别是邃思2.5推理芯片和邃思2.0训练芯片,应该算是燧原的第二代产品了。此前电子工程专辑对这些芯片做过专门的介绍。

▲ 云燧T21,里面是邃思2.0芯片,看这个形态就知道是OCP OAM;300W最大功耗;32 TFLOPS FP32算力,128TFLOPS TF32算力,128TFLOPS FP16算力,128FTOPS BF16算力,256TOPS INT8算力;32GB HBM2e内存,1.6TB/s带宽;PCIe 4.0 x16接口,片间互联300GB/s;

▲ 云燧T20,基本属于T21的PCIe版,规格为PCIe全高全长、双槽位;

▲ 云燧i20,基于邃思2.5,是张推理加速卡,不同精度的理论算力与上述板卡产品类似;内存规格16GB HBM2e,819GB/s带宽;150W功耗被动散热。在生成式AI对推理请求数量需求极速增长的今天,这张卡应当会是个大热门;

▲ 其实这台云燧S201-L液冷开放加速计算服务器(8/16张卡),及其构成的POD集群(8台服务器),在去年WAIC上也展示过。去年我们也报道了燧原发布这款云燧智算机(CloudBlazer POD),乃是燧原系统层面的产品补全。“每个单元TF32算力8PetaFLOPS”,“横向扩展藉由‘超千卡规模集群’可突破E级算力”。

今年这套方案(具体是CloudBlazerPOD液冷集群)在WAIC上获得了2023 SAIL Award(Super AI Leader)——SAIL之星。去年张亚林就在演讲中说“液冷是大势所趋”。

现场工作人员告诉我们:“现在不少城市和政府对能耗有要求,特别是大型及以上数据中心:PUE(能源效率,Power Usage Effectiveness)1.3以下才能叫绿色低碳数据中心。我们可以达到1.1以下,在国内的液冷系统中是很靠前的。”

“我们在杭州、成都的AI算力中心项目都已经落地了。这种一体化、POD的展现形式可以进行快速的搭建。”

▲ 如文首所述,AI芯片、板卡和系统层级的硬件之外,燧原主要演示的都是AIGC应用。上面这个“文生PPT”是个挺有趣的生成式AI展示,是基于输入自动生成PPT。图片中演示的这个demo是基于“新能源”这个词自动生成的PPT。

在输入“新能源”三个字之后,选择生成大纲——若对大纲满意,则基于大纲选择生成PPT,等待大约50秒的推理,就呈现了相对完整的PPT内容。PPT里面的文字、图片都由模型自动生成。

这个演示用到了不同的开源模型,包括Firefly、Stable Diffusion等。感觉对这个demo精调一下,做更精准的需求输入,做PPT这个活儿的确可以由机器来干了...

▲ 更纯粹的不同聊天机器人的演示。其中LLaMA的这则演示“偏向单问单答的内容生成”,工作人员解释说,“可以让它做文案之类的工作,生成比较长篇的文本”;“而ChatGLM是互动式、多轮对话的应用,它还会不断修正结果”。

这两个演示分别应用了云燧T20和云燧i20——基于上述两个模型对应6B和7B的参数规模,似乎云燧的训练和推理卡的确在类似场景下是可以互通的,即便或许效率上仍然是不一样的。

▲ 还有一些生成式AI的应用,如虚拟数字人播报,以及将生成式AI应用到更具体的领域内——如上图的金融、电力行业,未来AIGC在更多行业的落地需要依托此类模型或训练方式(guardrail)的发展...

实际上,对于芯片企业而言,自己构建完整的AIGC生态,始终是保持客户黏性并扩大市场的关键。这些模型及训练和开发工具就格外重要。这应该也是下面这款名为“曜图”的产品发布的依据。

▲ 这次燧原展位最大的热点就是新发布的“燧原曜图”(LumiCanvas)——这是个和Midjourney有些类似的text-to-image(文生图)服务,也就是输入提示词,对应地生成图片。不过曜图是个企业级方案,燧原在介绍中提到曜图“开箱即用、所见即所得、创意无限”。

虽然在现场我们没有听到燧原谈起曜图的具体业务模式,不过总体来看这是个MaaS(Model-as-a-Service)平台服务。“主要目标客户在游戏、影视等行业。” 现场工程师说,“曜图就像是个基础画板,(客户)可以自己去训练。我们预制了5种算法,客户可以去训练自己想要的模型,效果也会更好。”“网上一些开源的模型,可以直接放到我们的平台上来使用。”

以游戏为例,“有一些客户在做游戏之前,要做游戏角色模型。那么就可以通过我们这个平台去生成他想要的角色图片”,就类似于将原画的工作交给AI完成,“如果对生成的角色满意,还可以指定生成对应的动作,然后按照图片来建模。”

除了底层算力——也就是算力主体的AI芯片、板卡,及系统层面的硬件支持都由燧原提供,工程师告诉我们,燧原也构建起了上层软件栈:“曜图包括了底层硬件,到软件、上层生态,一整套交付。”所以曜图应该是满足企业客户做文生图服务部署的全套方案。

官方资料中提到,“燧原曜图集成了图像预处理、姿态建模、外部模型一键导入等能力,能够胜任多样化应用场景需求。与此同时,它还支持以Excel形式批量导入prompt,单次最多可支持千条prompt导入,充分释放生成效率,提升底层算力资源利用率。”

另外工程师还说,曜图也“包含prompt提示词助手,可能有些小白不了解怎么输提示词,那么就可以选择一些备选进行生成”——这里所说的提示词助手,涵盖了“prompt词典、大师经典作品prompt模板沉淀、逆向prompt等在内的全面prompt工具体系”。

所以这个平台构建了从算力到云服务、模型,再到用户使用的一体化流程,企业客户可以借助曜图,来做模型微调到最终部署,“利用平台工具链加速工作流程,不断迭代和更新”。

曜图应当是燧原落实硬件-系统-软件全栈方案的其中一环。如前所述,这类产品对未来的曜图而言会越来越重要。即便在应用和生态多样性上,英伟达仍然占据相当的优势,曜图对于国内AI芯片企业而言也是AIGC生态构建相当出色的开始。

燧原科技创始人兼COO张亚林说,“燧原曜图的推出,是我们在AIGC战略布局的第一步,通过创新的服务产品与商业模式,基于云的杠杆效果,把算力和服务无缝结合直接赋能到最终用户。”

责编:Illumi
  • 是有点离谱的
  • 150W功耗被动散热,你确定??
阅读全文,请先
您可能感兴趣
9月10日,苹果发布了一系列新品,包括iPhone 16系列手机、Apple Watch Series 10智能手表和AirPods 4耳机。发布会后网上响起了一片吐嘈声,带着这些吐槽,我们来看看这次苹果到底有没有新玩意……
Rambus的HBM4控制器IP还具备多种先进的特性集,旨在帮助设计人员应对下一代AI加速器及图形处理单元(GPU)等应用中的复杂需求。这些特性使得Rambus在HBMIP领域继续保持市场领导地位,并进一步扩展其生态系统支持。
2016-2023年中国独角兽企业总估值由近5000亿美元持续攀升至超1.2万亿美元,其中在2020年首破万亿美元。
HBM4作为第六代HBM芯片,不仅在能效上较现有型号提升40%,延迟也降低了10%,成为各大芯片厂商竞相追逐的焦点。
对于股价波动的原因,寒武纪表示,除了公司经营层面的因素外,还可能受到其他因素的影响。寒武纪还提醒投资者,应甄别信息来源,具体情况以公司公告为准。
此次财报也从侧面反应了半导体行业在AI业务上的强劲增长势头,但同时也暴露出非AI业务增长乏力的困境。
• 得益于西欧、关键亚洲市场和拉丁美洲市场的增长,以及中国品牌的持续领先,全球折叠屏手机出货量在2024年第二季度同比增长了48%。 • 荣耀凭借其在西欧特别强劲的表现,成为最大的贡献者,成为该地区排名第一的品牌。 • 摩托罗拉的Razr 40系列在北美和拉丁美洲表现良好,为其手机厂商的出货量贡献了三位数的同比增长。 • 我们预计,头部中国手机品牌厂商的不断增加将至少在短期内抑制三星Z6系列在第三季度的发布。
AI技术的发展极大地推动了对先进封装技术的需求,在高密度,高速度,高带宽这“三高”方面提出了严苛的要求。
奕斯伟计算2024首届开发者伙伴大会以“绿色、开放、融合”为主题,从技术创新、产品应用、生态建设等方面,向开发者、行业伙伴等相关方发出开放合作倡议,加速RISC-V在各行各业的深度融合和应用落地,共同推动RISC-V新一代数字基础设施生态创新和产业发展。
2024年 Canalys 中国云计算渠道领导力矩阵冠军厂商分别是:阿里云、华为云和亚马逊云科技(AWS)
在全球智能手机竞争日益激烈的情况下,谁能在高端市场站稳脚跟,谁就占据了主动权。一直以来全球智能手机市场格局都是,苹果专吃高端,其他各大厂商分食全球中低端市场。但现在市场正在其变化。根据Canalys最
文|德福很多去成都旅游的朋友都有个疑惑——为什么在成都官方的城市标志上看不到熊猫,而是一个圆环?其实这个“圆环”大有来头,它被唤作太阳神鸟,2001年出土于大名鼎鼎的金沙遗址,距今已有三千余年历史。0
天眼查信息显示,天津三星电子有限公司经营状态9月6日由存续变更为注销,注销原因是经营期限届满。该公司成立于1993年4月,法定代表人为YUN JONGCHUL(尹钟撤),注册资本约1.93亿美元,
据市场调查机构Allied Market Research的《单晶硅晶圆市场》报告指出,2022年单晶硅晶圆市场价值为109亿美元,预计到2032年将达到201亿美元,2023年~2032年的复合年均
在德国柏林举行的IFA 2024上,AMD计算和图形业务集团高级副总裁兼总经理Jack Huynh宣布,公司将把以消费者为中心的RDNA和以数据中心为中心CDNA架构统一为UDNA架构,这将为公司更有
会议预告向世界展示中国最具创新力、领导力和品牌化的产品与技术!9月27号,“第6届国际移动机器人集成应用大会暨复合机器人峰会”将在上海举行,敬请关注!逐个击破现有痛难点。文|新战略半导体行业高标准、灵
疫情后的劳动力囤积和强有力的员工保护规则掩盖了德国高薪制造业工作市场令人担忧的变化。根据联邦劳工办公室的数据,欧元区最大经济体德国的失业率在2019年春季曾达到历史最低点4.9%,现已上升至6%。虽然
8月28-30日,PCIM Asia 2024展在深圳举行。“行家说”进行了为期2天的探馆,合计报道了200+碳化硅相关参展企业(.点这里.)。其中,“行家说”还重点采访了骄成超声等十余家企业,深入了
点击蓝字 关注我们准确的图像深度和细节对于安保摄像头、人脸识别设备和机器视觉设备至关重要,可以提供更真实且高保真的观看体验。为在具体应用中达到这一效果,需要具备某些图像传感器功能,其中之一就是自适应局
在苹果和华为的新品发布会前夕,Counterpoint公布了2024年第一季度的操作系统详细数据,数据显示, 鸿蒙操作系统在2024年第一季度继续保持强劲增长态势,全球市场份额成功突破4%。在中国市场