你的位置:开云(中国)kaiyun网页版登录入口 > 新闻动态 > 欧洲杯体育大模子不会眯眼睛?为了考证这一彭胀-开云(中国)kaiyun网页版登录入口
欧洲杯体育大模子不会眯眼睛?为了考证这一彭胀-开云(中国)kaiyun网页版登录入口
发布日期:2025-09-17 08:43    点击次数:123

欧洲杯体育大模子不会眯眼睛?为了考证这一彭胀-开云(中国)kaiyun网页版登录入口

又一个让大模子险些一网尽扫的贫寒出现了。

小心看,这张丹青的是谁?

要是不够昭彰,那再眯着眼睛看呢。没错,等于蒙娜丽莎。

这张来自日本艺术家北冈秋吉前几天创作的一张图,效果径直把一众大模子难倒了。

ChatGPT 只可永诀出这是一张脸。。

Gemini 则是径直识别错了东说念主。

网友:懂了,大模子不会眯眼睛。

大模子不会眯眼睛?

为了考证这一彭胀,我们也进行了一波简便实测。既然径直问「画的是谁」问不出来,那给少许指示,让它不错尝试眯着眼睛。

领先来看 ChatGPT 的清晰。

它能准确判断出这是一张视觉错位图,也通过「眯着眼睛」识别出来了具体的脸部综合,效果在终末关头识别错了。

而再让它深度想考一下,谜底给不出来了。

Gemini 的复兴则还停留在多样神采的条纹,也辩认出这是个侧脸的综合。

Grok 则径直暗示无法辩认,让我提供一张更明晰的相片,emmm …

再来望望国产玩家的清晰,依然挑出三个来望望。

豆包的复兴与 Gemini 相似,鄙俗判断出图像的作风、东说念主脸综合,可是无法判断具体任务。

但选择深度想考之后,它深刻筹议了故障艺术的通说念分离特质,然后从玄色综合中判断出这是爱因斯坦(????

可能这蓬松的长发不是一个类型的吧。

将这个问题交给 Qwen。厚爱复兴这个问题的是 Qwen3-235B-A22B,在完成深度想考之后,它发现了这是个东说念主的侧脸剪影。但依然莫得判断出画的这个东说念主是谁。

而元宝、讯飞的复兴如下:

△元宝

△讯飞星火但 o3-Pro 一次性复兴对

不外在一众模子一网尽扫之际,也依然有得分选手。

比如o3-Pro。

网友进一步分析了原因。这可能与模子推理轨迹相干。比如像 o3(非 pro 版)想考链路里,它频频会在 Python 中旋转、加多对比度、编著等。而 o3-pro 昭彰推理才略更强。

但有东说念主怀疑了,它是不是用搜索了。

不外这被发现者驳回了。领先 o3 也不错用搜索,但无法作念到这少许。况兼从 o3-pro 的推理摘抄中看,它只好在应答后才略看到它(可能是通过使用器具)。况兼要是只问"这是什么?",它也不起作用。

还有尝试了三次的 GPT-4o。

不外这合理怀疑,仅仅它未必猜对了。

因为网友在它第一次打错之后,就给模子指示说这是一张著名的画作。于是就无语玩起了「海龟汤」的游戏。。。

又或者让 o4-mini-high 先东说念主为地应答图像以使其"眯眼",然后就能识别图像。

好了,感好奇的一又友不错去尝试一下。有挑战告捷的友友,不错在指摘区共享下指示词训导 ~

参考聚拢:

[ 1 ] https://x.com/svpino/status/1940924964431188137

[ 2 ] https://x.com/goodside/status/1941296192656376297

一键三连「点赞」「转发」「小心心」

迎接在指摘区留住你的主义!

—  完  —

专属 AI 家具从业者的实名社群,只聊 AI 家具最落地的真问题   扫码添加小助手,发送「姓名 + 公司 + 职位」肯求入群~

进群后,你将径直取得:

  � � 最新最专科的 AI 家具信息及分析 � �  

  � �   不如期披发的热点家具内测码 � �

  � �   里面专属本色与专科究诘 � �

� � 点亮星标 � �

科技前沿进展逐日见欧洲杯体育



相关资讯