正文内容 评论(0)
号称业界最高水平!Meta公布文生图模型CM3Leon
快科技7月16日消息,近日,Meta宣布,将开发一款名为CM3Leon的AI模型,该模型能够根据文本内容生成图片,也可以为图片生成文本描述。
Meta方面表示,CM3Leon在文生图方面的表现,达到了业界最高水平。
这意味着,该模型的表现将超越谷歌、微软等厂商的一众产品。
目前,Meta已经演示了CM3Leon的表现,展现了该模型在包括复杂的文本提示生成图片、根据文本指令编辑图像等方面的表现。
据悉,为了训练该模型,Meta使用了数百万张来自Shutterstock的授权图片,有着高达70亿个参数,这是OpenAI的EALL-E2模型的两倍以上。
不过,Meta也承认,现阶段的CM3Leon模型可能存在数据偏见的问题,仍然需要行业监管。
快科技延展阅读:
CM3Leon是一款基于Transformer神经网络结构的模型,该神经网络的特性是利用注意力机制来处理输入数据。
这一特点使得相较基于Transformer神经网络的模型,相较基于diffusion的模型具有更高的训练效率,且计算成本更低。