OpenAI的图像生成技术即将迎来重大升级。据社交平台X上的消息,OpenAI正在通过Chatbot Arena测试新一代图像模型GPT-Image-2,测试期间使用了maskingtape-alpha、gaffertape-alpha和packingtape-alpha等代号。尽管相关测试页面已暂时下线,但部分ChatGPT用户已开始体验灰度版本。
新模型最引人注目的改进是彻底解决了长期存在的"黄色滤镜"问题。自DALL·E时代起,用户就发现生成的图像普遍带有暖色调光晕,即便在GPT-Image-1中有所改善,但冷色调科技场景仍会意外出现温暖光晕。实测显示,GPT-Image-2生成的图像色彩还原精准,能够完美呈现用户要求的冷色调场景。
文字渲染能力的突破堪称革命性进步。此前AI模型在生成文字时普遍存在乱码问题,店铺招牌的字母常呈现扭曲状态。GPT-Image-2不仅成功生成了包含多语言电子广告牌的赛博朋克场景,还能精确呈现网页截图和解剖图的专业标注。特别值得关注的是手写笔记的生成效果,笔迹自然流畅,仿佛真实用笔书写而成。
尽管文字渲染仍有提升空间——某次生成李白《静夜思》草书时出现笔画不连贯和多余诗句的情况——但模型对中文字形结构的理解已达到惊人水平。能够呈现具有书法美感的连贯笔画,本身就标志着技术的重要突破。
人物真实感方面,新模型实现了质的飞跃。网友通过对比OpenAI首席执行官山姆·奥特曼的自拍生成效果发现,GPT-Image-2能精准还原皮肤质感、眼尾皱纹、胡须细节甚至发丝光影,而前代模型生成的图像则显得粗糙模糊。这种进步使得AI生成的人物图像几乎达到以假乱真的程度。
随着测试结果的持续流出,图像生成领域的竞争格局正在发生微妙变化。谷歌此前凭借Nano Banana模型在真实感和文本渲染领域占据优势,但GPT-Image-2的横空出世可能将重新定义行业标准。这场由技术突破引发的变革,正在悄然改写AI图像生成的未来走向。












