人工智能初创公司 Etched 最近宣布推出了名为 "sohu "的新型 Transformer ASIC,声称速度比英伟达的 H100 GPU 快 20 倍。

人工智能初创公司 Etched 最近宣布了一项重大突破,他们推出了名为 "sohu "的新型 Transformer ASIC,声称速度比英伟达的 H100 GPU 快 20 倍。

Transformer是谷歌开发的一种设计深度学习模型的架构,目前已成为 ChatGPT 中 OpenAI 的 GPT-4o、Antrophic Claude、Google Gemini 和 Meta 的 Llama 系列等模型背后的动力源。Etched 希望创建一个仅用于处理Transformer模型的 ASIC,并制作了一款名为 Sohu 的芯片。

哈佛华人辍学生创办的AI芯片公司

据了解,Etched 成立于 2022 年,是一家专门开发人工智能计算硬件,尤其是大型语言模型 (LLM) 硬件的公司,主要是通过专门针对Transformer架构进行优化的硬件,从根本上削减 LLM 推断成本。

Etched 由两位哈佛辍学生 Gavin Uberti(前 OctoML 和前 Xnor.ai 员工)以及 Chris Zhu 创立。

Uberti 曾在编译器领域做过暑期实习生,之后他和 Chris Zhu 开始在一家芯片公司工作。这让他接触到了 Etched 背后的底层硬件理念。

两人于 2022 年从哈佛大学退学,并招收了 Uberti 的大学室友 Wachen。他们很快开始招聘芯片行业资深人士。

作为 Etched.ai 联合创始人,Chris 目前正在开发下一代 LLM 加速器系统。在此之前,Chris 曾在哈佛大学担任各种计算机科学课程的教学研究员。Chris 还曾在亚马逊和 AvantStay 担任软件工程师实习,分别专注于后端物联网基础设施和 AWS 全球收入运营。

此外,Chris 还曾在哈佛本科资本合伙公司担任分析师,并在麻省理工学院担任研究员。更早之前,Chris 还曾担任波士顿大学 PROMYS 的初级辅导员。

截至 2024 年,Etched 共有 35 名员工,并已在 A 轮融资中成功募集到 1.2 亿美元。

Primary Venture Partners 和 Positive Sum Ventures 领投了此轮融资,并获得了 Hummingbird、Fundomo、Fontinalis、Lightscape、Earthshot、Two Sigma Ventures(战略)和 Skybox Data Centers(战略)等机构投资者的支持。

值得一提的是,该公司的天使投资人包括 Peter Thiel、Stanley Druckenmiller、  David Siegel、Balaji Srinivasan、Amjad Masad、Kyle Vogt、Kevin Hartz、Jason Warner、Thomas Dohmke、Bryan Johnson、Mike Novogratz、Immad Akhund、Jawed Karim 和 Charlie Cheeve。

泰尔奖学金主任亚历克斯·汉迪 (Alex Handy) 在一份声明中表示:“投资 Etched 是对人工智能价值的战略押注。他们的芯片解决了竞争对手不敢解决的可扩展性问题,挑战了同行普遍存在的停滞不前现象。Etched 的创始人体现了我们支持的非传统人才——从哈佛辍学,进军半导体行业。他们付出了艰苦的努力,以便硅谷的其他人可以继续安心地编程,而不必担心他们正在研究的任何底层技术。”

比NVIDIA H100快20倍的Sohu

上文提到,Etched 的芯片名为 Sohu,是一款 ASIC(专用集成电路),该芯片支持多达 100 万亿个参数的人工智能模型,是 GPT-4 1.8 万亿个参数设计的 8 倍。

据称,Sohu 的性能要比英伟达公司最新、最好的产品高出整整一个数量级。一台服务器配置 8 个英伟达 H100 GPU 集群,每秒可处理 25,000 个 Llama-3 70B 模型,而最新的 8 个 B200 "Blackwell "GPU 集群每秒可处理 43,000 个模型,而 8 个Sohu集群每秒可输出 500,000 个模型。

在制程方面,Sohu采用台积电 4 纳米工艺制造,配备 144GB HBM3E 内存。

Sohu实现了 90% 的 FLOPS 利用率,而传统 GPU 的利用率仅为 30-40%,这就意味着能效的提升。 

鉴于前沿模型的开发成本超过 10 亿美元,而硬件成本则以百亿美元计,因此拥有一个专门为特定应用供电的加速器有助于更快地推进人工智能的发展。

Sohu是如何实现比NVIDIA H100快20倍的?

Uberti 表示,通过专注于Transformer,以可预测的方式将数据从芯片移动到内存,Etched 的 Sohu 芯片可以将更少的空间分配给内存,将更多的空间分配给决定芯片原始计算能力的晶体管类型。

Eteched 效率的另一个方面是该芯片有一个大核心。这样一来,由流式多处理器协调不同核心计算所进行的低效计算就会减少。

Etched 的创始人预计,运行这些模型的芯片的需求将会增加,特别是一旦它们每分钟用于为 AI 软件提供数百万次服务。

他们还表示,通过将 AI 架构硬编码到芯片中,他们的设备可以减少返回答案的延迟,解锁新的用例,例如 AI 代理或实时语音对话。

Etched 表示,由于其架构更简单且用例单一,其芯片的速度比 Nvidia 的 GPU 快20倍。

责编:Demi
本文为EET电子工程专辑原创文章,禁止转载。请尊重知识产权,违者本司保留追究责任的权利。
阅读全文,请先
您可能感兴趣
“机器狼群”是一种高度智能化的无人作战系统,由多个不同功能的“机器狼”组成,每个“机器狼”在团队中扮演特定角色,形成高效的协同作战单元。
此次仲裁的核心争议在于,杨植麟和张宇韬在未取得循环智能投资方的同意豁免书之前,便启动了融资并创立了月之暗面。2024年3月,月之暗面旗下AI应用产品Kimi大火,甚至出现二级市场Kimi概念股。
有人评论:AlphaFold-3解决了长距离依赖问题,还能预测RNA等分子结构,甚至细胞内部生化过程,这简直就是生物信息学领域的一场革命。
该计划将通过补贴和其他财政援助的形式,在未来数年内支持芯片制造商,特别是下一代芯片的研发和量产。这一计划是日本政府综合经济方案的一部分,预计将在2024年11月22日由内阁批准。
根据台湾地区的技术保护法规,台积电被禁止在海外生产2纳米芯片,这意味着该公司必须将最尖端的技术保留在本土。
DF30芯片是业界首款基于自主开源RISC-V多核架构、采用国内40nm车规工艺开发的高端车规MCU芯片。该芯片实现了全流程国内闭环,功能安全等级达到了ASIL-D,并已通过295项严格测试。
为了更直观地了解FinFET到GAAFET架构世代的差异,本文利用高倍率的电子显微镜影像进行深入的探讨与分析,观察其于结构微观层面上的特征...
汽车技术领域正处于关键的转折点,其未来依托于动态且适应性强的系统,并可通过软件不断提升驾驶体验。
连接标准联盟很高兴宣布 Matter 1.4 现已正式发布,可供设备制造商和生态平台开发应用。这次更新是Matter生态系统迈出的重要一步。Matter 1.4带来了一系列增强功能......
根植雄厚研发实力及物联网领域的深耕实践,汇顶科技面向新兴车载互联应用全力进击。旗下首款高可靠性、高性能车规级低功耗蓝牙SoC——GR5405,已成功通过AEC-Q100 Grade 2认证。
据36氪报道,保时捷负责采购的执行董事傅伦轲(Barbara Frenkel)向其透露,“我正在与电池、ADAS、互联、娱乐系统等方向的中国供应商接触,希望建立新的合作。”今年前三季度,保时捷在中国市
全新产品几乎适用于任何应用,大幅减少元件数量、BOM成本和占板空间   瑞萨电子今日宣布,推出全新AnalogPAK™ IC系列,其中包括低功耗——SLG47001/
近几年,越来越多的中国电子零部件企业将目光投向海外市场,寻求“出海”机会。有一家坐落于深圳龙岗坂田的企业,在高端豪华车、工业控制上的产品成功获得了行业标杆客户的订单,出口额更是突破百万美元,成为“出海
东芝电子今日宣布,最新开发出一款用于车载牵引逆变器[1]的裸片[2]1200 V碳化硅(SiC)MOSFET“X5M007E120”,其创新的结构可实现低导通电阻和高可靠性。X5M007E120现已开
英国豪华跑车制造商路特斯宣布,由于市场需求变化和市场环境演变,公司将在英国裁员 200 人。上周,路特斯向员工确认了裁员消息,表示公司将尝试重新安置部分员工,并计划探索如何“在企业内部保留特定技能和知
 会 议 预 告  活动倒计时 8 天11月20-21日 | 行家说新型显示全产业链年会近期,点莘技术、秋水半导体、纳视智能、睿励科学仪器等4家Micro LED相关企业相继完成新一轮融资,单笔金额最
国芯网[原:中国半导体论坛] 振兴国产半导体产业!   不拘中国、放眼世界!关注世界半导体论坛↓↓↓11月12日消息,据台媒报道,继台积电宣布对中国大陆AI芯片企业暂停7nm及以下先进制程代工服务后,
艾迈斯欧司朗今日宣布,推出新一代高性能LED——OSCONIQ® C 3030。这款尖端LED系列专为严苛的户外及体育场照明环境而设计,兼具出色的发光强度与卓越的散热效能。其支持高达
EETOP讯,据中国台湾《经济日报》报道,美国出口管制措施进一步升级,不仅传闻台积电将因遵循规定而停止向中国大陆的非消费类AI芯片客户提供7纳米制程产品,三星也同样受到限制,无法承接相关订单。(参考阅