3 月 16 日下午14时,百度在北京总部召开新闻发布会,百度CEO李彦宏宣布正式推出大语言模型生成式AI产品“文心一言”。
距离其首次官宣过去了一个多月。这款产品被视为中国版ChatGPT,在这一个多月内备受关注。百度也给予这款产品极大的重视。发布会上,李彦宏及百度首席技术官王海峰发表演讲。
李彦宏展示了“文心一言”在文学创作、商业文案创作、数理推算、中文理解、多模态生成五个使用场景中的综合能力。
在文学创作场景中,“文心一言”根据对话问题将知名科幻小说《三体》的核心内容进行了总结,并提出了五个续写《三体》的建议角度,体现出对话问答、总结分析、内容创作生成的综合能力。此外,“文心一言”准确回答了《三体》作者、电视剧角色扮演者等事实性问题。面对“于和伟和张鲁一有哪些共同点”、“于和伟和张鲁一谁更高”这类问题,“文心一言”也基于推理能力得出了答案。
在商业文案创作场景中,“文心一言”顺利完成了给公司起名、写 Slogan、写新闻稿的创作任务。“文心一言”大模型的训练数据包括万亿级网页数据、数十亿的搜索数据和图片数据、百亿级的语音日均调用数据,以及 5500 亿事实的知识图谱等。
据百度介绍,“文心一言”还具备了一定的思维能力,能够学会数学推演及逻辑推理等相对复杂任务。面对“鸡兔同笼”这类锻炼人类逻辑思维的经典题,“文心一言”能理解题意,并有正确的解题思路,进而像学生做题一样,按正确的步骤,一步步算出正确答案。
在此基础上,“文心一言”还表现出中文理解及多模态生成能力。现场展示中,“文心一言”正确解释了成语“洛阳纸贵”的含义、“洛阳纸贵”对应的经济学理论,还用“洛阳纸贵”四个字创作了一首藏头诗。
多模态生成方面,李彦宏现场展示了“文心一言”生成文本、图片、音频和视频的能力。值得一提的是,“文心一言”甚至能够生成四川话等方言语音;“文心一言”的视频生成能力则因成本较高,现阶段还未对所有用户开放,未来会逐步接入。
李彦宏表示,大模型将不仅仅影响搜索行业,而且能让各行各业的企业离客户更近。李彦宏表示,有机构预测,在人工智能的帮助下,到2030年,脑力劳动者的生产效率可以提升4倍。他还称大模型将提供三大产业机会,包括新型云计算、行业模型精调和应用开发。
略有遗憾的是,“文心一言”并没有现场展示编程相关的能力。但王海峰透露,“文心一言”的训练数据中同样包括代码。在发布会刚召开10分钟,百度官方视频号直播已经有10万人看过。网友在评论中刷屏说,希望尽快公测。不过,目前“文心一言”还没有全面对外开放,产品采取邀请测试方案。3月16日起,首批用户可通过邀请测试码,在“文心一言”官网体验产品,后续将陆续开放给更多人。
值得一提的是,3月15日,OpenAI 刚刚推出了大型多模态模型 GPT-4,具备有更广泛的常识和解决问题的能力,可以更准确地解决难题。这次百度的“文心一言”,能获得市场的认可吗?从市场表现看,“文心一言”发布后,百度盘中股价跌幅一度扩大超10%,报120.1港元,截至下午3点,跌幅收窄至7.34%,报123.8港元,有所回弹。发布会结束,网友反应最多的是“演示过程提前录制有点败好感”,对于这一点,李彦宏的解释是,给出的问题都比较长,为了节约现场时间,所以才用了提前录制的形式。
李彦宏:“文心一言”还不完美
发布会上,李彦宏提到,内测中“文心一言”的能力不能算是完美。那么,百度为什么要在此时发布这个产品?
他回答说,因为有市场需求。他表示,百度各产品线,从搜索、智能云、自动驾驶、小度等,都在等着要用这样的技术。外部市场上,客户和合作伙伴也等着,大家都在催,所以要尽早的发布出来。
根据百度公布的数据,自2月份百度官宣“文心一言”以来,有超过650家企业宣布接入“文心一言”生态。
李彦宏还说,大语言模型一旦发布出来,就会获得真实的反馈。有了反馈之后,迭代速度、能力提升会加快。
对于产品能力,李彦宏说,有时会有惊喜,也会有错误,但有一点是肯定的,进步速度会非常快。“我们相信,人工智能会彻底改变我们今天的每一个行业。AI的长期价值,对各行各业的颠覆性改变,才刚刚开始。未来,将会有更多的杀手级应用、现象级产品出现,将会有更多的里程碑事件发生。”他这样说。
数据显示,自 2 月份百度官宣“文心一言”以来,已有超过 650 家企业宣布接入“文心一言”生态。百度首席技术官王海峰表示,“文心一言”是新一代知识增强大语言模型,是在 ERNIE 及 PLATO 系列模型的基础上研发的。它的关键技术包括有监督精调、人类反馈的强化学习、提示、知识增强、检索增强和对话增强。前三项是这类大语言模型都会采用的技术,ERNIE 和 PLATO 中也已经有应用和积累,在“文心一言”中又有了进一步强化和打磨;后三项则是百度已有技术优势的再创新。
来源:网络内容综合
推荐阅读