2017年除夕,深圳龙岗警方借助第一代“深目”系统,在15小时内跨省找回被拐儿童,使一家人得以团聚。这套系统,来自2014年8月在深圳成立的云天励飞公司。相关阅读:《“确认过人脸,是那个拐走孩子的人”》
2014年,陈宁博士从美国来深,创立云天励飞。人脸识别系统最开始是通过摄像机、端云协同的架构,通过摄像机的抓拍在云端去做海量的图片分析与处理,所以最开始算法在泛化能力上较弱,所以对于设备的调试就会要求特别高,于是在2015年,陈宁与两位创始团队同事经常扛着大包小包的工具,穿插在大街小巷调试设备。
2018年,云天励飞第一代自研芯片DeepEye1000一次性留片成功;2022年,Edge10V流片成功;2023年4月4日,云天励飞成功登陆上交所科创板,成为深圳第一家上市的人工智能企业。
今年以ChatGPT为代表的AIGC工具的出现,标志着人类生成效率出现了第二次脑力效率飞跃,推动了整个AI产业的发展。语言大模型(LLM)的相关应用其实已经很多,包括:
- 2023年2月,以色列总统艾萨克·赫尔佐格使用ChatGPT撰写演讲稿,为网络安全会议“2023特拉维夫全球网络技术”致辞;
- GPT-4根据一张手绘网站草图,自动生成网站搭建代码,使用者只需一键复制即可快速构建起自己设计的网页;
- AI生成的作品《太空歌剧院》在美国一场美术比赛一举夺冠。
蒸汽机的出现带来了第一次工业革命,电力的广泛应用带来第二次工业革命,第三次工业革命的标志则是发明计算机、信息化。
“我们认为AI是打开第四次工业革命大门的钥匙,所以云天励飞也在AI算法、芯片和应用等方面积极贡献自己的力量。” 在8月28日举办的第三届滴水湖中国RISC-V产业论坛上,深圳云天励飞技术股份有限公司芯片BD总监 张福林 介绍了公司从自研芯片、算法到边缘端设备的布局。
深圳云天励飞技术股份有限公司芯片BD总监 张福林
云天励飞芯片核心团队一直在从事矢量处理器研发,具备超过14年设计经验。2015年至今,完成了3代指令集架构,4代神经网络处理器架构研发。基于算法芯片化的思路采用“双轮驱动”理念:
- 通过对于芯片产品打造产品应用;
- 基于应用海量数据反哺算法,通过对于算法的理解来指导芯片的设计。
“通过这样的数据赋能方式,基于算法芯片化的技术平台,我们会构造一系列的系统解决方案去支持自进化城市智能体。” 张福林说到,“基于这样的理念,我们通过自定义指令集、自定义神经网络处理器架构、SoC设计及工具链的协同努力去促进芯片在各种应用场景下的计算高效性,以及对于场景的适应性。”
据介绍,Edge10V作为系列化芯片,有两个大点:
- 处理器全国产
CPU:内置RISC-V 大核CPU (单核5.8 DMIPS/MHz)
NPU:内置云天励飞第四代自主知识产权 NPU NNP400T(12Tops@int8)
GPU:内置GPU GC8000L,性能对标Arm Mali G52
- 生产制造全国产
采用国产14nm工艺,国产基板和封装,由国内供应商在国内工厂完成生产制造与测试。实现芯片设计生产加工全流程自主可控。
“我们采用了国产的工艺、国产的封装,由国内工厂完成国内生产制造交付。对于云天励飞自己而言,也是从设计到生产的全流程。” 张福林说到,作为AP级的边缘计算SoC,也不仅仅只做AI处理,Edge10V可以支持双千兆网口、多路网络接入,也支持不同传感器的接入,另外还有8x PCle3.0接口支持不同的外设扩展。
在CPU方面,Edge10V配备基于64-bit RISC-V核心的CPU@1.2GHZ矢量处理器,遂于边缘AI SoC来说具备不错的CPU能力和算力。其中较大的优势集中在“有效算力”,张福林认为,Edge10V的NPO算力较强,基于芯片也有对应的软件栈,“其中核心部分就是基于异构的芯片架构,有匹配的软件设计,可以很好的去做调度。另外就是把很多计算资源,通过合理分配到不同的硬件加速器里运行。”
谈到AI芯片,绕不过去的就是对AI工具链、模型的支持,目前云天励飞基于TVM设计了一套系统来支持Pytorch、Onnx、Caffe等主流工具,也支持CNN、RNN、Transformer的模型,可以对外提供SoC芯片以及一系列的模组产品。
边缘计算因为场景的碎片化,可能会有很多量比较小的需求,云天励飞也有针对性的做了一些芯片模组产品。包括针对嵌入式设备的MINI PCIe加速卡,可以应用到边缘服务器产品,同时也有SoC的主控应用和单芯片方案。
从产品的形态来说,云天励飞Edge10V主要覆盖端和边缘。边缘主要是边缘的Device和Server,在Device可以支持边缘视觉分析的终端盒子产品,以及机器人相关应用。服务器应用主要是集成到PCle加速卡,做一些高密视频推理。