电子工程专辑讯 近日,国家超级计算天津中心(简称,天津超算中心)“2023第七届世界智能大会” 上亮相天河新一代超级计算机和“天河·天元AI大模型“。天河新一代超级计算机是中国新一代百亿亿次超级计算机,并首次以概念造型展示国内自主研发的E级超级计算机。
”天河·天元“是立足于国产天河超级算力和智能算力打造的生成式AI大模型。据悉,天河·天元生成式智能体验区在现场备受欢迎,“天河·天元”以实时智能问答、互动交流进行交互,体验数字人、声音问答、声音克隆等人工智能多模态生成能力。未来,以生成式AI为基座的产业链将成为智能化升级过程中大规模服用的基础设施。
中文语言大模型——天河天元大模型是天津超算中心搜集整理了网页数据、各种开源训练数据、中文小说数据、古文数据、百科数据、新闻数据,以及专业领域的中医、医药、问诊、法律等多种数据集,最终训练打造出出来的。
“天河E级智能计算开放创新平台”将带来突破百亿亿次的跨模态的超级计算算力,支撑传统的科学工程计算,并服务智能混合计算,打造全方位的算力赋能创新和数字经济高质量发展载体。
天津超算中心是由科技部于2009年5月批准成立的首家国家级超级计算中心,由天津市滨海新区和国防科技大学共同建设,部署有2010年11月世界超级计算机TOP500排名第一的“天河一号”超级计算机和百亿亿次“天河三号”原型机系统。
“天河三号”原型机系统入选由两院院士投票评选的2018年度中国十大科技进展新闻。天津超算中心构建有超算中心、云计算中心、电子政务中心、大数据和人工智能研发环境,是我国应用范围最广、研发能力最强的超级计算中心,为全国的科研院所、大学、重点企业提供了广泛的高性能计算、云计算、大数据、人工智能等高端信息技术服务。
在5月18日,天津超算中心与中国工业互联网研究院签署战略合作,天津超算中心表示,双方的合作将基于各自的行业经验、资源优势和技术基础,依托超级计算与大数据、云计算融合服务环境,研发面向工业互联网应用的生成式人工智能技术,推进面向工业互联网的“网算”融合平台建设,支撑重点区域、重点行业、重点企业工业互联网创新应用,促进行业企业数字化、智能化转型升级,形成典型示范效应,推动智能制造领域发展。
自OpenAI发布的ChatGPT高调出圈,百度打响国内大模型第一枪后,生成式AI大模型落地产品遍地开花,如华为推出的盘古,阿里推出的通义千问,澜洲科技推出的孟子MChat可控,商汤推出商量日日新,腾讯推出混元AI大模型等,复旦大学推出的MOSS刚上线就遇到访问量太大服务器承受不了而停机,以仅开放邀请制内测的方式来缓解服务器压力。
来源网络汇总
国内各大科技企业入局AI大模型,通过大模型来助力场景的深度融合,配合专业工具和平台来支持应用落地。大模型厂商主要包括百度、腾讯、阿里、商汤、华为等企业,也有智源研究院、中科院自动化所等研究机构,同时英伟达等芯片厂商也纷纷入局。在英伟达的GTC2023 上,英伟达以AI芯片为重点,公布了新的双 GPU NVLink 产品 H100 NVL,最新版本的 DGX 采用 8 个相互连通的英伟达 H100 GPU,将其作为巨大的单一 GPU 使用。“英伟达 DGX H100 堪称全球客户构建 AI 基础设施的蓝图”,而且目前这款产品已经全面投产。英伟达还公布了NVIDIA DGX Cloud人工智能云服务,帮助初创公司和大企业运用 DGX 的强大能力加快新产品开发和 AI 战略的推进。在算力时代,英伟达无疑是大赢家。
阿里云“通义千问”
通义千问是一个超大规模的语言模型,功能包括多轮对话、文案创作、逻辑推理、多模态理解、多语言支持,能够帮助用户续写小说,编写邮件等。现阶段该模型主要定向邀请企业用户进行体验测试。
阿里巴巴达摩院(杭州)科技有限公司申请注册“通义千问”商标,国际分类为网站服务,当前商标状态为申请中。
阿里巴巴集团董事会主席兼CEO、阿里云智能集团CEO张勇表示,阿里巴巴所有产品未来将接入“通义千问”大模型,进行全面改造,包括天猫、钉钉、高德地图、淘宝、优酷、盒马等。
2023年4月18日,钉钉首次发布基于“通义千问”大模型的智能化能力,用户输入斜杠“/”即可唤起10余项AI能力。钉钉总裁叶军在北京宣布钉钉正式接入通义千问大模型,全面启动智能化战略。并现场实机演示了钉钉接入大模型后的一系列功能,包括使用AI生成推广文案、使用绘图方式创建应用、在视频会议中生成摘要等。
在4月,通义千问也将接入天猫精灵,据悉,天猫精灵已开启相关内测招募,拥有任意天猫精灵音箱设备即可参与报名,时间为 4 月 13 日至 12 月 31 日。
百度文心一言
文心一言(英文名:ERNIE Bot)是百度全新一代知识增强大语言模型,文心大模型家族的新成员,文心一言是知识增强的大语言模型,基于飞桨深度学习平台和文心知识增强大模型。在ChatGPT无法在国内使用,又热度不减的时候,文心一言的发布赚饱了流量,褒贬各异,不过与ChatGPT相比还是有很大的距离。据百度消息,截至3月18日11点,文心一言发布两天,已有12家企业完成首批签约合作。
IDC评估结果显示,百度文心大模型处于第一梯队,产品能力、生态能力达到L4水平,应用能力达到L3水平。
百度文心围绕大模型产业应用的不同研发环节,面向各阶段不同技术、业务背景的开发者或用户,打造系列工具平台与场景化产品。
面向开发者,拥有面向NLP工程师的大模型套件ERNIEKit,包括数据标注与处理、大模型精调、大模型压缩、高性能部署、场景化工具五大模块能力,还有AI开发平台,包括零门槛AI开放平台EasyDL,和面向AI算法开发者提供全功能AI开发平台BML。
面向下游应用,文心开放了API接口,包括NLP大模型ERNIE3.0、跨模态大模型ERNIE-ViLG、对话大模型PLATO。
面向用户,推出了基于大模型驱动的新一代产业级搜索系统文心百中,以及AI艺术与创意辅助平台文心一格。
华为盘古
华为云团队于2020 年立项AI 大模型,并且于2021 年4 月发布“盘古大模型”。受益于华为的全栈式AI 解决方案,大模型与昇腾(Ascend)芯片、昇思(MindSpore)语言、ModelArts 平台深度结合。
2022年11月,在华为全联接大会2022中国站上,华为云进一步迭代盘古大模型的技术能力,扩展盘古大模型的服务范围,发布盘古气象大模型、盘古矿山大模型、盘古OCR大模型三项重磅服务。
4月8日,华为云人工智能领域首席科学家田奇表示,华为云盘古大模型推动人工智能开发从“作坊式”到“工业化”升级。目前,华为已陆续发布矿山、气象、海浪等系列盘古行业大模型,展望未来,AI for Industries是人工智能新的爆发点。
在NLP大模型上,华为盘古聚焦文本生成与内容理解,已进入智能文档搜索、智能ERP、小语种大模型领域,落地企业财务异常检测、阿拉伯语大模型等场景。
上海证券分析师陈宇哲在研报中称,在早前的华为开发者大会上,华为曾宣布盘古大模型是业界首个千亿级生成与理解中文的NLP大模型,其认为未来有望成为国内最强的Chat GPT应用。