题图由文心大模型4.0 Turbo生成 大模型浪潮已经持续了两年多,早已从对技术的“好奇心”转向大规模应用,而“幻觉”正是制约大模型应用落地的一大绊脚石。大众认知被刷新的同时,也为AI作为生产力工具铺平了道路。 |
第一步是对用户的需求进行分析理解,自动规划精确或泛化方案,比如对哪些实体进行增强; 第二步是对需要增强的实体,检索并选择相应的参考图; 第三步是生成图像,使用了百度自研的多模可控生图大模型,通过注意力计算,在保持实体特征不变的情况下,实现了图像的高泛化生成,比如根据牛顿的肖像,生成绘本风格的牛顿(在实际落地应用中,iRAG也支持用户上传参考图,生成用户期望的图片)。
主理人 | 张贺飞(Alter)
前媒体人、公关,现专职科技自媒体
钛媒体、36kr、创业邦、福布斯中国等专栏作者
转载、商务、开白以及读者交流,请联系个人微信「imhefei」