OpenAI新版4o逆袭-重返大模型竞技场榜首

OpenAI新版4o逆袭-重返大模型竞技场榜首

作者:news 发表时间:2025-08-12
穆迪首席经济学家:美国经济衰退迫在眉睫,关税收入绝非长久之计 首程控股附属发布机器人公司相关榜单 3万亿商业保理行业望迎新规,“擦边球”消费贷业务将被禁止这么做真的好么? 徐小明、冯矿伟等十大投资名师直播解盘:大盘继续高歌猛进,AI科技再领风骚最新进展 A股公司又现“炒股热”!多家上市公司拟花超10亿炒股 二级市场比主业更赚钱? 华泰证券:流动性行情中谁在加仓?实垂了 年内第二次!瑞达期货再收监管罚单 鼎亿集团投资授出合共4950万份购股权后续反转 金价创近3个月最大单日跌幅金价大跌近2.5%官方处理结果 预期“美国滞胀”且美联储降息空间有限,德银建议:做空十年期美债反转来了 健康掌握在自己手中 张伯礼:医生的救治并非包治百病秒懂 核心业务动能不足 皇氏集团资产负债率创新高秒懂 特朗普:见普京将是试探性会晤 “可能头两分钟就知道能否达成协议”后续来了 年内第二次!瑞达期货再收监管罚单 上市公司现金分红总额再创历史新高 博雅互动被纳入MSCI全球小型股指数成份股秒懂 海隆控股:清盘呈请聆讯押后专家已经证实 日本日经225指数升破历史最高收盘水平 投资者对关税的担忧缓解 债市高位震荡运行 利率衍生品变身风险管理“重器” 贝森特:货币政策独立性正在受损,新任老大需具备前瞻思维 高管频换规模腰斩 北信瑞丰基金陷发展困局 债市高位震荡运行 利率衍生品变身风险管理“重器” 产品供给不断丰富 资本市场更好服务养老金融 一村镇银行进入破产程序 大连农商行承接客户存款后续来了 高管频换规模腰斩 北信瑞丰基金陷发展困局科技水平又一个里程碑 宁家服务全球门店超过1100家 ,宁德时代打造新能源后市场标杆后续会怎么发展 从自身攻坚到全链推进 光伏产业减碳加速破局最新进展 特朗普点名要求会面 英特尔CEO周一将赴白宫官方已经证实 通用设备行业董秘观察:新莱应材朱孟勇因内幕交易被罚没217万元 2024年薪酬为51万元秒懂 专用设备行业董秘观察:*ST星农王黎明收3次警示函 薪酬为30万元记者时时跟进 2025年中信用趋势|商业银行:银行业务增长和盈利性承压,政府支持态度保证高风险银行的正常经营是真的? 洪田股份:控股子公司掩模版和玻璃基板设备所获订单金额约375万元是真的? 专用设备行业董秘观察:兰石重装武锐锐收3次警示函 并记入诚信档案 薪酬为45万元秒懂 专用设备行业董秘观察:汇隆活塞刘迪2024年薪酬为36万元 较前一年薪酬上涨203%专家已经证实 上市银行首份半年报出炉,赚得投资收益同比涨30%至12亿,代销理财规模增155%是真的? 永和股份:2025年半年度净利润约2.71亿元,同比增加140.82%后续会怎么发展 实时报道 瑞银因供应强劲、库存增加下调布油价格预期后续会怎么发展 增值税法实施条例向社会公开征求意见,有哪些看点?后续会怎么发展 国际钾肥走向如何?来看全球最大的钾肥生产商分析 后续反转 瑞银因供应强劲、库存增加下调布油价格预期学习了

在万众瞩目的新加坡OpenAI开发者日活动中,ChatGPT再度展现了其非凡的实力。最新版本的ChatGPT-4o(简称4o)在备受关注的大模型竞技场中一举夺魁,将此前占据榜首的Gemini拉下了马。

OpenAI新版4o逆袭

此次4o的更新重点在于“创意写作能力”,据官方介绍,新版本能够生成更加自然、吸引人且有针对性的文本,显著提升了文本的相关性和可读性。4o在处理上传文件方面也进行了优化,能够提供更深入的见解和更全面的回应。

o1的核心贡献者Karina Nguyen对此次更新表示了肯定。她指出,作为Canvas功能的一部分,改进写作是一个顶级用例,有望改变人机协作的方式,让创作过程更具创造性。尽管她承认这一研究问题非常主观且开放,但至少在写作方面取得的进展对于实现AGI(通用人工智能)的创造性智能至关重要。

OpenAI新版4o逆袭

在大模型竞技场的创意写作分榜上,新版4o(ChatGPT-4o-1120)的得分从上一个版本的1365跃升至1402,进步显著。同时,在代码能力、数学能力、困难任务以及风格控制等多个方面,4o也均有所提升,成功从之前的第二名跃升至第一名。

OpenAI新版4o逆袭

然而,尽管4o的表现亮眼,但网友们对于OpenAI迟迟未推出o1满血版仍表示不满。一些网友在社交媒体上直言,希望OpenAI能够尽快放出o1,与近期备受瞩目的DeepSeek等模型进行正面较量。甚至有网友调侃称,OpenAI的更新策略似乎就是每当有其他模型登上榜首时,便迅速推出新版本夺回第一。

OpenAI新版4o逆袭

尽管4o在创意写作方面取得了显著进步,但仍有网友对其生成的内容进行了测试,并发现系统仍能够准确识别出这些内容为AI所写。不过,也有网友对4o的更新进行了深入研究,并发现OpenAI在系统提示词方面进行了优化,新增了一道护栏,以确保ChatGPT在敏感话题上不会胡说八道。

OpenAI新版4o逆袭

目前,新版4o已在大模型竞技场中上线,感兴趣的读者可以前往体验并分享自己的感受。对于未来OpenAI是否会推出o1满血版,以及它将如何与其他模型进行竞争,我们拭目以待。

相关文章