OpenAI最近几天更新了绘图能力,各式各样的图已经在网上刷翻了,确实相比于原来的Dall-e-3提升很多。让OpenAI又有了AI界大哥的风范。(由于deepseek的强势崛起,OpenAI前几次更新没有一丝波澜,包括12天发布会、o3发布、gpt-4.5发布这些都没有激起任何波澜,加上前几天谷歌出了绘图模型gemini2.0flash,感觉都快被淡忘了)。不过!这次OpenAI带来的GPT-4o绘图,确实有点东西:
- 指令遵从度很高,目前无可匹敌
GPT-4O延续了DALL·E系列的优良传统,能够高度精准地理解用户输入的指令,生成与描述高度吻合的图像。这一特性使其在众多AI绘图工具中脱颖而出。
- 艺术感稍逊MJ,但风格灵活
与Midjourney等专注于艺术表现的模型相比,GPT-4o在艺术感染力上略有差距,但其在风格多样性上的表现可圈可点,从经典动画到未来主义风格都能轻松驾驭。
- 中文支持大幅增强,对我们更友好
新增的中文拓字功能是一大亮点,用户可以用中文指令生成包含中文元素的图像,这一改进为中文用户提供了更便捷的创作体验。
- 风格一致性表现稳定,从一而终
在连续生成或多次修改图像时,GPT-4o能够保持风格的连贯性,避免了画面割裂感,为多轮创作提供了可靠支持。
缺点是,目前使用量过大,需要排队
尽管生成速度稍显逊色,但GPT-4o支持多轮生图和修图功能,用户可以通过对话逐步优化作品,真正实现了“用嘴修图”,PS软件估计要废了。。。
最近闲着没事,尝试了一下它的绘图能力,如下所示:
吉卜力风动画场景

生成的图像保留了吉卜力作品的温暖色调和细节质感,虽然人物形象略显圆润,但整体氛围与原作风貌高度契合。
美国漫画风

在还原美国自由主义漫画风格时,GPT-4o展现了惊艳的精准度,几乎完美再现了原作的笔触与神韵。
赛博朋克与像素风


从赛博朋克的冷酷光影到像素化的复古质感,风格切换流畅,细节处理令人满意。
图像修复与去水印

在重制任务中,GPT-4o的表现自然细腻,去水印后的效果几乎无缝,堪称实用。
乐高风格转换

以乐高风格重现经典角色时,标志性特征得以保留,画面生动有趣,颇具创意。
漫画转真人

将漫画人物转化为真人形象时,动作和整体气质表现到位,但面部特征略显偏差,欧美化倾向明显。
产品商标设计

为产品添加LOGO时,生成的标识质感真实,与背景融合自然,视觉效果出色。
如何体验GPT-4o的绘图功能
目前,GPT-4o的绘图功能尚未完全开放官方API,但用户可以通过智享导航(https://www.chatgpt5x.com/)国外AI通用网址提供的API模型“gpt-4o-image”进行体验。访问https://online.chatgpt5x.com即可购买和使用,操作简单且适合国内用户。

总结与未来展望
GPT-4o的绘图能力升级无疑为AI艺术创作注入了新的活力。其生成图像的还原度高达70%以上,AI痕迹较少,尤其在凭空想象和风格化任务中表现优异。然而,对于精细抠图或大幅修改等生产级需求,GPT-4o仍需进一步优化。OpenAI已承诺在未来几周内修复现有问题并开放API,届时其潜力将进一步释放。面对AI绘画技术的快速迭代,相关行业从业者或许需要重新审视自己的定位,以迎接这场技术变革带来的机遇与挑战。
PS:感觉每一波大厂的更新换代,就会倒闭一些以此为生的小公司啊