Meta 开发出文本生成图像模型 CM3Leon,号称业界最佳
IT之家 7 月 16 日消息,网Meta 公司宣布开发出一种名为 的人工智能模型,该模型可以基于文本生成高质量图像,为图像生成文本描述,甚至可以基于文本指令编辑图像。
IT Home 注释:生成的结果(上图)与 DALL-E 2 生成的结果(下图)相比
据Meta称,该模型实现了业界最高水平的文本到图像生成,超越了谷歌和微软等公司的产品。 它是基于 的模型,是一种利用注意力机制来处理输入数据的神经网络结构。 与其他基于扩散()的模型相比,该模型效率更高、训练速度更快并且计算成本更低。
Meta 在各种任务上展示了卓越的性能,包括根据复杂的文本提示生成图像、根据文本指令编辑图像以及生成图像描述和答案。 Meta表示,这是图像生成和理解领域的重大进步,但也承认该模型可能存在数据偏差问题,并呼吁提高行业透明度和监管。
Meta Inc. 使网用了来自 的数百万张许可图像。
Me网ta 没有透露是否会公开发布该模型。
广告声明:文章中包含的外部跳转链接(包括但不限于超链接、二维码、密码等)用于传达更多信息,节省选择时间。 结果仅供参考。 IT之家的所有文章均包含此声明。