在手机圈里,有句话叫做“不服跑个分“。用测试工具跑分,这个是用来衡量用户的手机的性能一个维度;常常是米粉、花粉、果粉几家打口水架常用的一些手段;
在看似高端大气上档次的AI 芯片领域,也同样如此;每年发布产品,都好比AI芯片华山论剑,但是如何一教高下,却是一个大问题;2018年,谷歌、英特尔、英伟达等AI芯片行业领军高手大家齐聚AI行业的“华山之巅”,制定了MLperf标准;通过这个标准涵盖了AI应用的大部分场景,所有参与AI领域的企业可以通过这个标准来衡量“功力深浅“。 MLperf 是用于测试机器学习硬件、软件和服务的训练和推理性能的公平和有用的基准。也是AI芯片也是各个厂家来营销的手段;通过这个标准的测试,“东邪西毒南帝北丐中神通”就可以一决胜负;
2020年5月份,NVIDIA宣布其A100 Tensor CoreGPU在加速器的全部8项MLPerf基准测试中展现了最快的市售商用产品性能;NVIDIA睥睨的看着其他对手,通过GPU演进而来的安培架构好比九阳神功,天下无敌;NVIDIA的GPU技术是AI教父GeoffHinton在2012年那篇CNN应用的开山之作《ImageNetClassification with Deep Convolutional NeuralNetworks》首先应用在AI领域计算的(具体见人工智能的芯片江湖(1));正所谓,天下武功,唯快不破,一步快,步步快,如今NVIDIA的从帕斯卡架构,伏打架构,安培架构,一步稳扎稳打,依然演变成为了AI芯片领域的王者,举手投足,九阳神功护体,自有大宗师气派,定能立于不败之地;
仅仅三个月后:GOOGLE表示就表示不服,宣称在最新一轮MLPerf基准测试中,Google最新的Tensor处理单元(TPU)芯片,打破了6项MLPerf基准测试记录。有点“独孤九剑”一出,可与“九阳神功”一战的意味;
GOOGLE在软件领域内力深厚,GOOGLE的TensorFlow作为一个开源的机器学习平台,拥有一个全面而灵活的生态系统,其中包含各种工具、库和社区资源,可助力研究人员推动先进机器学习技术的发展,并使开发者能够轻松地构建和部署由机器学习提供支持的应用,也聚集了大量的研究人员和厂商门派研究修炼;通过这些软件架构可以大大的降低研究和使用者进入AI的门槛;
但是研究AI芯片,GOOGLE的“独孤九剑”虽然自成一家,还是功力尚浅,因此GOOGLE招揽了计算机体系结构的开山宗师,斯坦福大学前总裁约翰·L·轩尼诗(John L. Hennessy)以及加州大学伯克利分校退休教授大卫·A·帕特森(David A.Patterson),Hennessy还成了谷歌的掌门人,因此,GOOGLE在架构上,采用Hennessy和Patterson的推崇的DSA(领域专用处理器架构);借用DSA架构(这个DSA架构和Hennessy和Patterson的故事后篇单说),避开了原有通用计算对AI计算的先天不足,虽然研究没有NVIDIA的那么深厚,但也是各领风骚;
独孤九剑,讲究人剑合一;TPU可以适配GOOGLE的TensorFlow的软件架构,软件人员可以不用关心这些软件是运行在NVIDIA的GPU上,还是运行在GOOGLE的TPU上,总之,谁的结果快和经济,就用谁的;用户就是这么朴实无华,且枯燥;谁能让他们赢,谁能节省他们的资金,他们就用谁家的产品;况且GOOGLE还是四大云厂之一,自身的业务足以支撑TPU业务的发展;
从TPUv1只能做AI的推理,TPUv2和TPUv3就可以在AI的训练上和同时代的NVIDIA摆一摆手腕了,如今TPUv4要投入应用,GOOGLE已经成为这个江湖上重量级的玩家,AI芯片江湖上又是一场山雨欲来风满楼;
NVIDIA占据了先手,成为AI芯片当前王者,但是GOOGLE也对这个领域也是虎视眈眈;面对NVIDIA的“九阳神功”,“独孤九剑”剑走偏锋,但始终不能一击封喉,只能先立于不败之地,慢慢周旋,再伺机寻求取胜之机;因为这场高手对决才刚刚开始;是NVIDIA稳坐AI芯片宝座,还是会被挑落马下,取而代之,都需要时间的检验;