点击蓝字 关注我们
SUBSCRIBE to US
谷歌近日公布了其Parti文本到图像的计算机模型,该模型通过研究数百亿个参数来渲染超现实图像。
据悉,Parti 全称为“Pathways Autoregressive Text-to-Image”(路径自回归文本转图像)。随着可使用参数数量的增长,其输出的图像也能够更加逼真。该模型在生成最终图像之前研究了200亿个参数。
Parti与Imagen不同,Imagen是一种文本到图像生成器,谷歌设计用于扩散学习。该过程通过在图像中添加“噪声”来训练计算机模型,使其变得模糊。然后,该模型学习对静态图像进行解码,以重新创建原始图像。随着模型的改进,它可以将看起来像一系列随机点的东西变成一幅图像。
谷歌没有向公众发布Parti或Imagen,因为人工智能数据集存在偏见的风险。由于数据集是由人类创建的,因此它们可能会在不经意间陷入刻板印象或歪曲某些群体。这家搜索巨头在人工智能方面投入了大量资金,作为改进服务和开发环境计算的一种方式。在5月份的I/O开发者大会上,首席执行官Sundar Pichai表示,人工智能正被用于帮助Google Translate,在地图中创建3D图像,并将文档压缩为快速摘要。
据了解,Parti和Imagen并不是唯一的文本到图像模型。Dall-E、VQ-GAN+CLIP和Latent Diffusion Models是其他最近成为头条新闻的非谷歌文本到图像模型。Dall-E Mini是一种开放源码的文本到图像人工智能,可供公众使用,但在较小的数据集上进行训练。
微信号|IEEE电气电子工程师
新浪微博|IEEE中国
· IEEE电气电子工程师学会 ·
往
期
推
荐
最新《期刊引证报告(JCR)》发布,IEEE期刊在相关技术领域继续保持领先
《2022年全球科技社团发展指数报告》发布 IEEE再次荣登世界一流科技社团排行首位
论坛第二场预告 | 与2023年IEEE当选主席候选人论坛面对面
以古生物三叶虫为灵感的相机拥有巨大的景深