刚刚,OpenAI 发布了新版 ChatGPT Images,由全新的旗舰级图像生成模型驱动。
最新的图像生成模型能够精准编辑图像,同时保留所有细节,并且图像生成速度提升高达 4 倍。
研究团队还在 ChatGPT 中引入了一项全新的图像功能,旨在让图像生成变得轻松愉悦,激发灵感,让创意探索变得毫不费力。
ChatGPT 的全新图像模型今天面向所有用户推出,API 版本为 GPT Image 1.5。
更精准的编辑
GPT Image 可以更精准地遵循用户的指令。当要求对上传的图像进行编辑时,模型只更改用户要求的内容,同时保持光照、构图和人物外观等元素在输入、输出和后续编辑中保持一致。
该模型擅长各种类型的编辑——包括添加、减去、组合、混合和转置。
该模型的创意体现在其对元素(例如文本和布局)的变换上,这些变换能够将想法生动地呈现出来,同时保留重要的细节。
这些变换适用于简单和复杂的概念,并且可以使用全新 ChatGPT 图片功能中的预设样式和创意轻松尝试——无需任何文字提示。
该模型更能可靠地遵循指令,也能创作出更复杂的原创作品,并且能够按预期保留元素之间的关系。
与此同时,该模型在文本渲染方面又向前迈进了一步,能够处理更密集、更小的文本。
该模型还改进了其他方面,从而带来了更直接可用的输出,例如渲染许多小脸以及使输出看起来更自然。
改进与局限性
结果表明,模型在各种情况下都表现出明显的改进,但仍不完美。虽然此次发布代表着显著的进步,但在未来的迭代中仍有很大的提升空间。
结合上图来看,虽然仍存在一些科学上的不准确之处,但约有 70% 是正确的,而且画面更加生动,避免了过早裁剪。
API 中的 GPT Image 1.5 提供了与 ChatGPT Images 相同的所有改进:它在图像保存和编辑方面比 GPT Image 1 更强大。
与 GPT Image 1 相比,GPT Image 1.5 的图像输入和输出成本降低了 20%,因此您可以用相同的预算生成和迭代更多的图像。
Wix 人工智能研究与数据科学主管 Hila Gat 表示,“GPT Image 1.5 能够生成高保真图像,并具有极强的响应速度,能够保留构图、光照和精细的细节。生成的图像清晰、逼真且可靠,支持在 Wix 等平台上加快从概念到制作的工作流程。”
参考资料:
https://openai.com/index/new-chatgpt-images-is-here/
发表评论
登录
手机
验证码
手机/邮箱/用户名
密码
立即登录即可访问所有OFweek服务
还不是会员?免费注册
忘记密码其他方式
请输入评论内容...
请输入评论/评论长度6~500个字
暂无评论
暂无评论