当前位置:当前位置: 首页 >
如何看待机器之心重测高考数学全卷,Gemini夺冠,豆包DeepSeek并列第二?
文章出处:网络 人气:发表时间:2025-06-19 14:30:12
当务之急最该解决的问题是大众对于 AI大模型的正确认知以及最基本的AI用法。
你看这是前两天的测试结果,突出了一个政治正确,6款大模型,OpenAI的o3倒数第一,我当时看到的时候就觉得很奇怪,o3好歹也是曾经的一代王者,高考数学这种题它排名这么低怕不是有什么猫腻。
我们就拿单选题的第五题来测试下,因为这道题除了o3,其他的国产模型都答对了。
这是第五题的原题,正确答案是A. - 1/2。
这是之前的第三方的测试结果,6个模型…。
同类文章排行
- 湖南台AI主播被骂上热搜,但AI每小时喂5700 万条「错误信息」没人管_Google_搜索引擎_新闻
- 调查“活鱼***”,更要清理市场潜规则丨九派时评_商户_商家_水产
- 黄仁勋罕见谈生死:希望在工作中突然离世,重申不信任“继任者***”_公司_访谈_科技
- 中国机器人,梦想是当打工仔_模型_小脑_全世界
- 解散xAI ,马斯克和Anthropic都赢麻了_Claude_合作_Code
- 近日,中国重磅官宣了一则消息,仿佛从天而降的炸弹,直接把美、日、荷等国给打傻了。原来,我国自行研发的全球首台万通道 3D 纳米激光直写光刻机,正式发布了,而且将于27年下半年实现商用量产,一举打破了美、日、荷等国对我国的芯片的长期垄断。4月10日,浙江大学实验室里的一台设备悄然完成了它..._浙大
- 病毒还是革命?专家:未来不会用“龙虾”或智能体,相当于文盲,相当于不会用手机_田丰_陈焕_skill
- 台积电魏哲家:中国机器人跳来跳去,没用,好看头而已!_发展_演讲_人类
- 影石冒险一战,大疆强势反击_刘靖康_无人机_产品
- 微信龙虾插件上线72小时,就被OpenClaw一次更新干崩了_代码_qqbot_官方
最新资讯文章
- 大厂们的“龙虾”之战:云端全面出击,腾讯最为激进,Token为王的时代即将到来_OpenClaw_Agent_微信
- 安卓厂商的「集体阳谋」:能打电话的「大号手机」,真能抄了iPad的后路?_平板_功能_产品
- 流量来路如何区分,自然流量和竞价流量的辨别 - *
- 出轨怀孕打小三:水果AI***成功拉低全世界智商_香蕉_草莓_人类
- 以***乱真的AI造图,却让人后背一凉_Images_网友_马斯克
- 宇树G1韩国佛门受戒 法号迦悲 立下不过度充电等专属五戒_机器人_佛教_仪式
- 宇树科技:离赚钱很近,离应用很远_机器人_公司_人形
- 王自如公布智能指环项目 售价或超4000元 目标全球第二_戒指_马达和_Oura
- 手机涨价,华为苹果为啥不涨?_的成本_iPhone_***购
- 雷军被正名、OPPO创纪录、vivo放样张、荣耀静悄悄_Find_测试_小米
- 从“卷规模”到“找钱途”:年费最高5088元的豆包,为何敢卖这么贵?_包年_定价_用户
- 投资人们等不及 Kimi 上市了_模型_智谱_亿美元
- 做龙虾的大厂,没有梦想_入口_OpenClaw_微信
- 中国空调圈暗战正酣_格力_成本_海信
- 如何让你的***变成爆款 - *
- 苹果年度大会定档6月9日,升级版Siri成重头戏_iPadOS_液态_系统
- AI越火,科大讯飞越难_公司_盈利_净利润
- 马斯克给Claude送了22万张GPU,这下奥特曼又该瘫在椅子上了?_SpaceX_Grok_合作
- 美国***“炒”了科研外脑,顶尖科学家联名疾呼:中国在超车_特朗普_白宫_国家
- 创下西班牙最大宗仓储物业交易记录之一,菜鸟回应:持续投入,欧洲连开4仓





