接上文:
贯通现实知识4o的绘图,能够从大模型中直接获取到知识,生成与现实世界知识相符的图像,如:可以直接使用的鸡尾酒配方
Prompt:Makemeaprofessionallyshotphotorealisticdiag,"4mostpopularcocktails"
制作一款披萨
Prompt:AgraphicofanItalianchefgivinginstructionsonhowtomakeauthenticpepperonipizza
动量定理和冲量定理
Prompt:画一个有关冲量定理和动量定理的infographic
Prompt:画一个肯德基的简体中文菜单,其中有一个套餐叫做“V我50”
风格多样4o的这个模型,能轻松绘制各种风格的图像。比如我让他用莫奈的风格,来画一只猫
Prompt:一只猫,莫奈风格
幻想风格的海豚地铁
Prompt:Arealisticunderwaterscenewithdolphinsswimmingthroughthewindowsofanabandonedsubwaycar,withbubblesanddetailedwaterflowaccuratelysimulated.
奥特曼在采棉花,颇有纪录片的范儿
Prompt:山姆奥特曼正在采棉花
一些限制当然,这个模型也存在一些问题:
·对于长图像,会出现剪裁问题
·可能产生幻觉,然后开始胡编乱造
难以准确渲染超过20个不同概念
·多语言文本渲染:处理非拉丁语言(比如中文),不够准确
·密集文本下,效果会不好
以及出于安全考虑,很多内容不允许被生成,比如:米老鼠大战皮卡丘的钞票
最后OpenAI这次的更新的确非常棒,真没得黑。
这项功能已经通过ChatGPTSora向Plus、Pro、Team和免费用户推出,替换DaLLE作为默认图像生成器。,Enterprise和Edu用户也将很快更新,API也将在数周内进行更新。
所以,不要小瞧OpenAI,箱子里有货的。