中国工程院院士:什么时候我们的算力超过美国,GDP也就可以超过美国了!

EETOP 2023-07-09 10:35
欢迎关注EETOP半导体资讯备用号


7 月 7 日消息,中国工程院院士、鹏城实验室主任高文在世界人工智能大会昇腾人工智能产业高峰论坛上演讲时表示,没有大算力做大模型就是天方夜谭,这就和电力是一样的,可以省点电做出什么产品来,别人真正懂行的人听了都不信的,一定要有算力作为基础。算力建设非常重要,就像电力一样。

高文院士表示:“美国的算力现在指数是排第一,比我们大概多了 30% 的算力,那么也就代表 GDP 也比我们多 30%,什么时候我们的算力超过了美国,咱们的 GDP 就可以超过美国了。

按照高文的说法,算力够,数字经济就能够发展好,算力指数和GDP是正相关的关系,算力越强GDP就越强。

他表示,从现在开始,算力也是数字经济发展的一个指数,算力够,你的数字经济就能够发展好,不够就发展不好。

以下为高文演讲全文:

各位专家、各位领导,大家下午好!

前面的领导都讲得很好,算力是非常重要的一件事,今天上午陈书记在讲的时候也讲到,上要抓三件大事,人工智能方面其中就有一个是算力建设,算力建设非常重要的一方面,就像电力一样。

从现在开始,算力也是数字经济发展的一个指数,你算力够,你的数字经济就能够发展好,不够就发展不好。所以,特别是智能算力就非常关键。

所以跟大家分享关于鹏城云脑的智算平台,再就是分享一下在这个平台上面做的鹏城脑海大模型。

首先,我们说算力很重要,重要到什么程度呢?

清华大学的一个 2022 年的咨询报告说到了,经过统计计算力指数和 GDP 是正相关的关系,你算力越强你的 GDP 就越强,最右边的图可以看到,美国的算力现在指数是排第一,比我们大概多了 30% 的算力,那么也就代表 GDP 也比我们多 30%,什么时候我们的算力超过了美国,咱们的 GDP 就可以超过美国了。

正是因为算力这么重要,所以发展人工智能和经济没有算力不可能,要有算力要有芯片,芯片做成机器,用这个机器训练这个模型,为了做这件事,我们在 2020 年深圳就做了一台机器,这台 机器叫鹏城云脑 II,这台机器的算力在 2020 年的时候是全世界做人工智能训练最强的一台机器,比当时微软、谷歌的机器都要强,相当于是 4000 块卡的机器,而且这台机器是 4000 块 A100 卡的机器,这台机器是用全光网络把它连起来的,节点和节点之间的延迟非常低。

因为,有了这台机器可以做很多事,包括我们可以做科学研究,可以做产业应用还有关键技术的研发。

这台机器刚刚我说有 4000 块卡,一个是鲲鹏 CPU,一个是昇腾 NPU,都是华为的。

有了这台机器以后,那么这台机器的性能行不行呢?就参加世界 TOP500 的超算的打榜,整个超算整个算力的打榜,同时它也有其他的赛道,我们参加的一 个是 IO500 的赛道,你的输出和输入能力的赛道,我们从 2020 年 10 月份这台机器做出来以后,11 月份就参加打榜,连续 6 次第一,每半年有一次打榜,全节点连续二次第一。

所以,这台机器在做人工智能训练这件事,别人没办法和它比。这台机器的 AI 算力,这个是三年一次的,也参加了打榜,连续三次第一。这台机器不仅硬件强,接口能力和网络非常强,同时上面的软件也是配备得比较完备,包括怎么样做分布式计算,怎么样做命令调优、自研的调度规划等等。这台机器这么大规模的机器以前还是第一次,相当于它的四台机器,其实是四台我们的机器组成这一台了,上面有很多软件的挑战。

可能有的专家也许听到过,有人说全世界能在 1000 块卡上同时选连一个模型的只有几千人,能在 4000 块卡上训练的不超过 100 个人,在 10000 块卡上训练模型的人数更少了,大规模的卡上一起做事,对于软件规划、资源调度挑战非常大。

我们不仅仅是把鹏城云脑 II 用好,我们也承担了国家发改委的任务,用鹏城云脑 II 类似的华为生态的,用在昇腾 AI 集群,不管是 100P 和 900P 的算力结点,我们用网络把资源连起来,可以给大家提供,告诉你这里有资源可以通过网络去用。

同时,我们还把华为生态以外的,按照发改委的要求,希望这是异构的算力网的平台,我们也选择了部分其他厂商的算力,在 2022 年 6 月这个项目验收的时候,已经聚合的智能算力到了 2300P,云脑 II 只是 1000P,这个系统已经聚集了 2300P 的智能算力。

我们有了云脑 II 可以训练大模型了,训练大模型还是很费算力的,但是即使你可以训练大模型,现在的需求根本不够用,我们正在规划做云脑 III。

下面我说说大模型,鹏城正在做一个大模型,这个是 2000 亿参数,也就是 200B 的参数,为什么做这件事呢?

不用再花时间了,因为有 Chat GPT 和类 Chat GPT 大模型在不停地涌现,同时因为现在很多公司都用这个东西做产业应用,去做服务。所以,现在这个模型变得很重要了,但是现在有钱的公司可以砸几个亿做这样的机器,甚至十几个亿和几十个亿,但是大多数的公司做不了。

这个领域需求这么大,怎么办呢?

我们鹏城实验室可以做一个底座,模型训练完开放出去,大家在这个底座说做垂直应用。按照这样的思路,我们首先有鹏城云脑 II 的算力,前一阶段我们积累了很多的数据,这一段时间前几个月我们通过各个渠道,包括购买拿到数据,先下面做清洗,清洗的数据很重,可能我拿到了 100 个数据,清洗完就剩几个了,因为有很多是重复和不规范的,这些东西拿掉就变得很小。虽然拿了很多的数据,但是真正用来做训练的数据只有 1%-5%。有了这个数据我们就可以做大模型底座。

这个大模型底座,我们就是用的生成式预训练模型,就是和 GPT 完全类似的底层的东西,用这个东西训练一个好的模型,希望可以开放出去。

现在这个模型我们想着 2000 亿参数,200B 的参数,这个训出来以后,我们希望把它给到合作伙伴那里,而且提供相应的指令微调和相应的人工增强学习的工具,甚至做一两个垂直领域,做样板作为垂直应用,怎么样用告诉大家,因为华为在这方面很有经验,我们建议谁想做垂直应用,可以到华为得到一些咨询用这个模型做他们的应用。

有了这个东西,我们希望能够快速把这个模型做完可以推向社会,让社会在这个模型上开发中国自己的人工智能大模型应用系统。现在我们正在紧锣密鼓往前推,应该是 8 月底第一次所有的训练就训练完了,9 月份就会把模型开放出去。

现在训练的数据有多大呢?我们说的是喂数据,每天喂 10 个 B,但是最重要喂一个 T 的数据,一个 T 是由几百个 T 清洗来的,现在数据都是中文和代码数据,现在 4000 多块卡的机器每天可以吃掉 10 个 B,100 天就能吃掉 1000 个 B,就是一个 T,我训练 2000 亿参数的模型,需要 4000 块卡训练 100 天。

这就是算力,你如果不够大的话,做一个模型还是很辛苦的,而且我现在才训练了一个 T 的数据,训练两到三个 T 的话,还要加两到三个 100 天,没有大算力做大模型就是天方夜谭,当然有很多人说我可以用限速(音)等等这样那样的,但是实际上这就和电力是一样的,可以省点电做出什么产品来,别人真正懂行的人听了都不信的,一定要有算力作为基础。

我们的算力到现在为止,怎么样把数据做好训练得快,我们有一套体系,有一个开源社区叫启智开源社区,这里面有很多的工程师做飞轮数据工程,可以使你清洗数据做得非常快,有很多自动和半自动的清洗数据,都可以帮助你。

模型训练,4000 块卡吃掉 10 个 B 的数据,整个的损失每天都在降一点,我 们看着特别高兴,每天有数据汇报,一天降了 0.2,我们现在大概在 2 的上下浮动,我们希望最终可以降到 1.8 左右。

这是训练的过程,同时我们要考虑应用的 时候有隐私数据有一些数据应用者,希望到你这个模型应用一下,但是不希望自己的数据被丢掉或者是看到,我们提供了隐私数据保护的模块,我们叫防损包,有了这样一套体系就可以支持应用了。

我们希望鹏城脑海出来了可以快速向社会赋能,可以让大家做数字政府、“一带一路”、智能制造、智慧金融、智慧医疗等等各种各样可能的应用,这里有黄颜色和白颜色,黄颜色是现在已经投进人去做了,你做指令微调和正向学习都需要。后面是放给合作伙伴去做的,而且我们还有一些完整的整个教育计划、人才计划,人才计划就希望这个模型训练放出来,大量培养人才,通过高校和合作伙伴培养,能让中国的大模型应用快速启动。

小结一下,鹏城实验室在鹏城云脑 II 硬件平台和鹏城脑海大模型这两件事都在和华为合作正在往前推进,希望可以对中国人工智能大模型用贡献一点力量,作为一个基石,希望大家多关心、多参与。

谢谢大家。


欢迎报名参加

高速芯片技术研讨会(明天下午13:00点)

【是德&ICisC 7月10日|南京】

EETOP EETOP半导体社区-国内知名的半导体行业媒体、半导体论坛、IC论坛、集成电路论坛、电子工程师博客、工程师BBS。
评论
  • 遇到部分串口工具不支持1500000波特率,这时候就需要进行修改,本文以触觉智能RK3562开发板修改系统波特率为115200为例,介绍瑞芯微方案主板Linux修改系统串口波特率教程。温馨提示:瑞芯微方案主板/开发板串口波特率只支持115200或1500000。修改Loader打印波特率查看对应芯片的MINIALL.ini确定要修改的bin文件#查看对应芯片的MINIALL.ini cat rkbin/RKBOOT/RK3562MINIALL.ini修改uart baudrate参数修改以下目
    Industio_触觉智能 2024-12-03 11:28 115浏览
  • 光伏逆变器是一种高效的能量转换设备,它能够将光伏太阳能板(PV)产生的不稳定的直流电压转换成与市电频率同步的交流电。这种转换后的电能不仅可以回馈至商用输电网络,还能供独立电网系统使用。光伏逆变器在商业光伏储能电站和家庭独立储能系统等应用领域中得到了广泛的应用。光耦合器,以其高速信号传输、出色的共模抑制比以及单向信号传输和光电隔离的特性,在光伏逆变器中扮演着至关重要的角色。它确保了系统的安全隔离、干扰的有效隔离以及通信信号的精准传输。光耦合器的使用不仅提高了系统的稳定性和安全性,而且由于其低功耗的
    晶台光耦 2024-12-02 10:40 144浏览
  • 当前,智能汽车产业迎来重大变局,随着人工智能、5G、大数据等新一代信息技术的迅猛发展,智能网联汽车正呈现强劲发展势头。11月26日,在2024紫光展锐全球合作伙伴大会汽车电子生态论坛上,紫光展锐与上汽海外出行联合发布搭载紫光展锐A7870的上汽海外MG量产车型,并发布A7710系列UWB数字钥匙解决方案平台,可应用于数字钥匙、活体检测、脚踢雷达、自动泊车等多种智能汽车场景。 联合发布量产车型,推动汽车智能化出海紫光展锐与上汽海外出行达成战略合作,联合发布搭载紫光展锐A7870的量产车型
    紫光展锐 2024-12-03 11:38 126浏览
  • 在电子工程领域,高速PCB设计是一项极具挑战性和重要性的工作。随着集成电路的迅猛发展,电路系统的复杂度和运行速度不断提升,对PCB设计的要求也越来越高。在这样的背景下,我有幸阅读了田学军老师所著的《高速PCB设计经验规则应用实践》一书,深感受益匪浅。以下是我从本书中学习到的新知识和经验分享,重点涵盖特殊应用电路的PCB设计、高速PCB设计经验等方面。一、高速PCB设计的基础知识回顾与深化 在阅读本书之前,我对高速PCB设计的基础知识已有一定的了解,但通过阅读,我对这些知识的认识得到了进一步的深
    金玉其中 2024-12-05 10:01 35浏览
  •         温度传感器的精度受哪些因素影响,要先看所用的温度传感器输出哪种信号,不同信号输出的温度传感器影响精度的因素也不同。        现在常用的温度传感器输出信号有以下几种:电阻信号、电流信号、电压信号、数字信号等。以输出电阻信号的温度传感器为例,还细分为正温度系数温度传感器和负温度系数温度传感器,常用的铂电阻PT100/1000温度传感器就是正温度系数,就是说随着温度的升高,输出的电阻值会增大。对于输出
    锦正茂科技 2024-12-03 11:50 146浏览
  • 最近几年,新能源汽车愈发受到消费者的青睐,其销量也是一路走高。据中汽协公布的数据显示,2024年10月,新能源汽车产销分别完成146.3万辆和143万辆,同比分别增长48%和49.6%。而结合各家新能源车企所公布的销量数据来看,比亚迪再度夺得了销冠宝座,其10月新能源汽车销量达到了502657辆,同比增长66.53%。众所周知,比亚迪是新能源汽车领域的重要参与者,其一举一动向来为外界所关注。日前,比亚迪汽车旗下品牌方程豹汽车推出了新车方程豹豹8,该款车型一上市就迅速吸引了消费者的目光,成为SUV
    刘旷 2024-12-02 09:32 143浏览
  • 作为优秀工程师的你,已身经百战、阅板无数!请先醒醒,新的项目来了,这是一个既要、又要、还要的产品需求,ARM核心板中一个处理器怎么能实现这么丰富的外围接口?踌躇之际,你偶阅此文。于是,“潘多拉”的魔盒打开了!没错,USB资源就是你打开新世界得钥匙,它能做哪些扩展呢?1.1  USB扩网口通用ARM处理器大多带两路网口,如果项目中有多路网路接口的需求,一般会选择在主板外部加交换机/路由器。当然,出于成本考虑,也可以将Switch芯片集成到ARM核心板或底板上,如KSZ9897、
    万象奥科 2024-12-03 10:24 96浏览
  • 概述 说明(三)探讨的是比较器一般带有滞回(Hysteresis)功能,为了解决输入信号转换速率不够的问题。前文还提到,即便使能滞回(Hysteresis)功能,还是无法解决SiPM读出测试系统需要解决的问题。本文在说明(三)的基础上,继续探讨为SiPM读出测试系统寻求合适的模拟脉冲检出方案。前四代SiPM使用的高速比较器指标缺陷 由于前端模拟信号属于典型的指数脉冲,所以下降沿转换速率(Slew Rate)过慢,导致比较器检出出现不必要的问题。尽管比较器可以使能滞回(Hysteresis)模块功
    coyoo 2024-12-03 12:20 171浏览
  • TOF多区传感器: ND06   ND06是一款微型多区高集成度ToF测距传感器,其支持24个区域(6 x 4)同步测距,测距范围远达5m,具有测距范围广、精度高、测距稳定等特点。适用于投影仪的无感自动对焦和梯形校正、AIoT、手势识别、智能面板和智能灯具等多种场景。                 如果用ND06进行手势识别,只需要经过三个步骤: 第一步&
    esad0 2024-12-04 11:20 110浏览
  • 11-29学习笔记11-29学习笔记习学习笔记&记录学习学习笔记&记录学习学习笔记&记录学习学习笔记&记录学习笔记&记录学习习笔记&记学习学习笔记&记录学习学习笔记&记录学习习笔记&记录学习学习笔记&记录学习学习笔记记录学习学习笔记&记录学习学习笔记&记录学习学习笔记&记录学习学习笔记&记录学习学习笔记&记录学习习笔记&记录学习学习笔记&记录学习学习笔记&记录学习学习笔记&记录学习学习笔记&记录学习学习笔记&记录学习学习笔记&记录学习学习笔记&学习学习笔记&记录学习学习笔记&记录学习学习笔记&记
    youyeye 2024-12-02 23:58 96浏览
我要评论
0
点击右上角,分享到朋友圈 我知道啦
请使用浏览器分享功能 我知道啦