OpenAI 发布最强编程模型 GPT-5.1-Codex-Max:AI 程序员能“通宵”,性能跑分反超谷歌 Gemini


openai 昨日(11 月 19 日)发布博文,宣布推出 gpt-5.1-codex-max 智能体编程模型,显著提升了长远推理能力、效率和实时交互能力。此外该模型将取代 gpt-5.1-codex,成为 codex 集成界面上的默认模型。

此次发布紧随谷歌 Gemini 3 Pro 之后,但在多个关键编程基准测试中,Codex-Max 展现出更强的实力。例如,在衡量解决实际软件问题的 SWE-Bench Verified 测试中,Codex-Max 以 77.9% 的准确率小幅领先于 Gemini 3 Pro 的 76.2%。

Codex-Max 在 Terminal-Bench 2.0 测试中也领先,准确率达到 58.1%,而 Gemini 的准确率为 54.2%;在 LiveCodeBench Pro(一项竞争激烈的编码 Elo 基准测试)测试中,它的得分与 Gemini 的 2439 分持平。

☞☞☞AI 智能聊天, 问答助手, AI 智能搜索, 免费无限量使用 DeepSeek R1 模型☜☜☜

GPT-5.1-Codex-Max 的一项重大架构升级是引入了名为“压缩”(Compaction)的机制。该机制允许模型在接近其上下文窗口限制时,智能地保留关键上下文信息并丢弃无关细节,从而实现跨越数百万 token 的连续工作而不会出现性能下降。

得益于此,该模型在内部测试中已成功完成持续超过 24 小时的复杂任务,如多步骤代码重构和自主调试。同时,这项技术还提升了约 30% 的 token 效率,有效降低了成本与延迟。

新模型目前已集成到 OpenAI 自家的多个 Codex 开发环境中,包括其官方命令行工具(Codex CLI)、内部代码审查工具以及各类交互式编程环境。

开发者可以通过这些工具体验到模型强大的实时交互能力,例如在可视化界面中进行强化学习训练或模拟光学定律。不过,GPT-5.1-Codex-Max 尚未通过公共 API 提供,但官方表示即将开放。普通用户则需要订阅 ChatGPT Plus、Pro 或企业版等付费计划才能使用。

OpenAI 透露,其内部 95% 的工程师每周都会使用 Codex,自采用以来,这些工程师平均多提交了约 70% 的拉取请求(Pull Requests),显著提升了内部开发速度。

尽管 Codex-Max 具备高度的自主性,OpenAI 仍强调它应作为编码“助手”而非人类的替代品。为保证透明度,模型会生成详细的终端日志和测试引用,以便开发者审查和验证其生成的所有代码。此外,模型在默认情况下运行于严格的沙盒环境中,并禁用了网络访问,以确保安全性。


# Token  # 命令行  # 交了  # 于此  # 更强  # 而非  # 中也  # 可以通过  # 但在  # 测试中  # 多个  # 重构  # 编码  # 架构  # gemini  # 开发环境  # gpt-5  # gpt  # openai  # chatgpt  # ai  # 工具  # 谷歌 


相关栏目: 【 Google疑问12 】 【 Facebook疑问10 】 【 网络优化91478 】 【 技术知识72672 】 【 云计算0 】 【 GEO优化84317 】 【 优选文章0 】 【 营销推广36048 】 【 网络运营41350 】 【 案例网站102563 】 【 AI智能45237


相关推荐: AI学习秘籍:3个高效黑科技,解锁智能学习新时代  播客数据深度解析:揭秘全球听众分布和增长策略  揭秘颜值真相:社交实验的背后,你是几分?  QRCODE.AI深度评测:AI驱动的二维码生成器优缺点分析  OpenAI Codex最强攻略:提升AI编码效率的秘诀  AI旅游攻略生成工具有哪些_一键生成行程规划的AI工具推荐  AI工具投资指南:10个关键要素,助您明智决策  电脑百度ai助手怎么关闭 电脑版百度ai助手移除教程  暖心“小艺通话”:让语障人士告别沟通困境,拥抱平等生活  使用ChatGPT快速生成专辑封面:AI艺术创作指南  Docker MCP Toolkit:简化AI代理与外部工具的连接  AI婴儿播客视频制作终极指南:免费工具与步骤  Sora AI:颠覆视频创作?OpenAI最新文生视频模型深度解析  在线奇幻名称生成器:打造独一无二的角色名  eBookWriter AI:无需写作也能创作专业电子书  n8n:零代码AI自动化平台的终极指南和免费VPS设置  Claude怎么用新功能会议纪要_Claude纪要生成使用【步骤】  讯飞星火怎么一键生成|直播|话术_讯飞星火话术生成与节奏把控【教程】  通义千问怎样优化提示词更口语化_通义千问口语化技巧【教程】  斑马AI能否关联学校教材_斑马AI教材同步与版本匹配【技巧】  Logic Pro 11更新全面解析:免费升级、AI功能与音乐制作流程  生成式AI革新客户服务:提升效率与个性化体验  利用 Gemini 1.5 Pro 进行超长视频摘要提取  智谱AI绘画怎么用_智谱AI绘画使用方法详细指南【教程】  AI写作工具检测:学生如何避免学术不端行为  AI赋能科研探索:Google Research创新加速科学发现  ChatGPT 如何助力建筑承包商?三大实用技巧解析  机器学习赋能AI生产力工具:提升效率与智能决策  AI无镜头相机Paragraphica:颠覆传统摄影的新方式  Claude如何保存对话记录_Claude对话保存步骤【步骤】  grokai如何生成动态图表_grokai动态图表生成工具使用及数据可视化技巧  feelin聊天官方网站入口 feelinAl官方网站  Hugging Face Transformers:文本分类的完整指南  Gemini 辅助进行多平台社交媒体内容调度  AI视频生成终极指南:免费为店铺打造引流爆款  Mootion AI视频生成器:一键创作动画故事!  探索古希腊之美:AI打造的绝|美女|神形象赏析  如何让ChatGPT模仿特定文风 创意写作与品牌话术生成教程  教你用AI一键去除图片水印,操作简单效果惊人  AIPPT:AI驱动的PPT制作工具,高效便捷演示文稿方案  教你用AI把照片变成动漫风格,3个简单步骤刷爆朋友圈  AI赋能副业:五大掘金机会,轻松开启智能创收时代  提升效率的AI工具:Jace、Yutori、Dia等效率神器测评  3步教你用AI将你的照片变成乐高积木风格  实测效率提升超35%!科大讯飞星火AIPC开启AI办公新纪元  怎么用AI帮你写一份有说服力的加薪申请?  普通人如何用DeepSeek月入过万?2026最新赚钱路径全解析!  Excel Copilot:AI驱动的强大新功能与实用案例解析  通义千问怎么找新功能入口_通义千问新功能查找【攻略】  解锁生成式AI工程师之路:技能、职业发展与未来趋势 

 2025-11-20

了解您产品搜索量及市场趋势,制定营销计划

同行竞争及网站分析保障您的广告效果

点击免费数据支持

提交您的需求,1小时内享受我们的专业解答。

南京市珐之弘网络技术有限公司


南京市珐之弘网络技术有限公司

南京市珐之弘网络技术有限公司专注海外推广十年,是谷歌推广.Facebook广告全球合作伙伴,我们精英化的技术团队为企业提供谷歌海外推广+外贸网站建设+网站维护运营+Google SEO优化+社交营销为您提供一站式海外营销服务。

 87067657

 13565296790

 87067657@qq.com

Notice

We and selected third parties use cookies or similar technologies for technical purposes and, with your consent, for other purposes as specified in the cookie policy.
You can consent to the use of such technologies by closing this notice, by interacting with any link or button outside of this notice or by continuing to browse otherwise.