40%算力训练效果比肩GPT-4,实测DeepMind联创大模型创业新成果


大模型竞赛,又杀出一匹黑马——

Inflection-2.5,由DeepMind联创Mustafa Suleyman的大模型初创公司打造。

只用40%的计算资源训练,表现就超过了GPT-4的九成,尤其擅长代码和数学。

☞☞☞AI 智能聊天, 问答助手, AI 智能搜索, 免费无限量使用 DeepSeek R1 模型☜☜☜

而早期的Inflection模型,训练时只消耗了4%的计算资源,就达到了GPT-4表现的72%。

以Inflection模型为基础,该公司还推出了网页端对话机器人Pi,主打“高情商”和“个性化”,还支持中文。

自诞生以来,Pi的最高日活达到了100万,累计产生了40亿条消息,平均对话时长来到了33分钟。

而随着这次基础模型的升级,Pi也迎来了它的新版本。

图片

那么,Inflection,或者说Pi,表现到底有没有那么强,量子位进行了一番实测。

无需登录即可使用

打开Pi的页面,映入眼帘的是这样一个极简界面,而且还可以不用登录,直接点击Next。

图片

连续Next几次后,输入希望Pi称呼我们的方式。

图片

之后是选择声音和推荐话题,直接跳过就可以了,然后就进入正式的聊天界面了。

图片

简单测试发现,Pi支持中文对话,既然如此那就先把弱智吧Benchmark给安排上。

第一题,老鼠生病了可以吃老鼠药治好吗,Pi成功解答。

图片

再来一道“陷阱”题,这次依旧没有上当。

图片

两道问题过后,虽然没有出现什么戏剧性效果,但看起来对中文也是有一定的理解了。

接下来就重点看看官方宣称“尤其擅长”的数学和代码能力。

首先是一道涉及动态规划的编程题目。

图片

Pi给出的代码成功解决了这个问题,并且配有清晰的解释。

图片

接下来再提升一下难度看看,让其分析一个数字的阶乘中末尾有多少个0。

图片

Pi给出的代码不仅正确,而且简洁高效,运行速度超过了LeetCode上73.8%的用户。

图片

最后再来增加一下难度,以一道47.5%通过率的题目结束代码部分的测试。

图片

看完代码,再来测测Pi的数学能力怎么样,让它做做关于导数的题目:

求出函数f(x)=x³+2x²-1的极值点

解答完全正确,而是十分详细。

当然要想数学好,逻辑思维是必不可少的,所以我们在常规的数学题之外,又用一道经典的题目考验了一下的Pi逻辑思维,结果还不错。


通过Pi的表现,可以看出其背后的Inflection-2.5模型的确可圈可点。

而从官方自己公布的测试数据来看,无论是综合能力还是各个子项,Inflection-2.5的表现都紧随GPT-4。

以数学和代码为例,Inflection-2.5在MATH、HumanEval等测试中都比1.0版本都有大幅飞跃。

在这些常规的数据集之外,Inflection还挑战了匈牙利高考数学试题和GRE物理测试,结果几乎与GPT-4打成平手。

更“刁钻”的,还有人专门用大模型难以理解的问题构建了一个BIG-Bench数据集,而Inflection-2.5挑战了其中的Hard子集,结果和GPT-4的差距不到一分。

那么,Inflection-2.5的背后,是怎样的一家公司呢?

DeepMind联创大模型创业

这家公司名叫Inflection AI,由DeepMind联创Mustafa Suleyman等人于2025年创立,目前共有70余人。

同样来自DeepMind的,还有资深研究员Karen Simonyan,现担任Inflection AI的首席科学家。

此外,LinkedIn联创Reid Hoffman也参与了Inflection AI的创立。

创立以来,Inflection AI已经获得了来自英伟达、微软、比尔盖茨等巨头的共计15亿美元的融资。

目前,基于Inflection的Pi还是免费的,但CEO Suleyman也表示,一直用爱发电不现实,长久地看以后还是要收费。

想要体验的朋友,可能要抓紧时间了~

传送门:https://pi.ai


# math  # 阶乘  # leetcode  # https  # gpt  # 再来  # 联创  # 求出  # 逻辑思维  # 匈牙利  # 的是  # 都有  # 超过了  # 还可以  # 那就 


相关栏目: 【 Google疑问12 】 【 Facebook疑问10 】 【 网络优化91478 】 【 技术知识72672 】 【 云计算0 】 【 GEO优化84317 】 【 优选文章0 】 【 营销推广36048 】 【 网络运营41350 】 【 案例网站102563 】 【 AI智能45237


相关推荐: 艺龙旅行AI怎样筛选最优车次_艺龙AI车次筛选与耗时最短推荐【攻略】  文本分类:生成模型与朴素贝叶斯算法的全面指南  AI写作避坑指南:小说家应避免的AI使用与创作技巧  Claude 4.5 深度解析: Coding, VS Code & AI Agent 新纪元  律师视角下的生成式AI:信息爆炸时代的法律实践与未来展望  Claude怎么用新功能表格生成_Claude表格生成使用【攻略】  Semrush AI标题生成器:免费提升SEO和内容创作效率  ChatGPT图像生成器完全指南:文化影响、伦理挑战与商业变革  AI人像摄影新纪元:Gemini AI助力照片编辑  DeepSeek 在量化交易策略回测中的实战教程  ChatGPT怎么用一键生成读书笔记_ChatGPT笔记生成教程【攻略】  改善面部不对称:简单有效的肌肉平衡技巧  ChatGPT助力Instagram Reels脚本创作:提升内容质量  AI末日预言?智能聊天机器人真的能替代信仰吗?  WorkPPT:AI驱动的PPT制作神器,效率提升不止10倍!  百度APP的ai助手怎么关闭 百度APP ai功能取消方法  如何用AI一键生成求职简历?AI简历优化与制作工具推荐【干货】  利用 Google AI 进行图像元数据分析与整理  AI电影制作:颠覆传统,引领未来*新纪元  Excel Copilot:AI驱动的强大新功能与实用案例解析  教你用AI将一段旋律扩展成一首完整的曲子  Saregama Carvaan: 5000首经典歌曲唤醒你的回忆  FeelinAI聊天网页版 Feelin官方网站地址  提升企业效率:QR Platform管理后台功能全面解析  AI怎么修复模糊视频 视频画质增强AI软件Topaz Video使用【教程】  AI 编码助手大比拼:Gemini、Tabnine 和 Cline 的深度测评  P&ID图完全解析:符号、应用及绘制指南  专家:26年1月中国车市将实现“开门红” 高端增长强劲  Tradie Hub:领先的线索管理系统,助力业务增长  百度ai助手怎么设置不显示 百度ai助手界面净化设置  AI广告全面解析:免费教程、JSON提示与营销策略  文心一言处理大规模中文报表数据的清洗技巧  Excel AI:5大免费AI功能提升数据分析效率  怎么用AI制作数字人短视频?3步教你创建虚拟主播  Midjourney怎样做PPT模板_MidjourneyPPT模板生成【方法】  为什么你的简历过不了筛选?用AI帮你诊断并修复漏洞  AI海报设计终极指南:工具、技巧与避坑全攻略  SteosVoice:电报语音克隆终极教程  使用文心一言进行中文客服话术库的逻辑优化  AI赋能音频转录:SovereignAudio自托管解决方案  稿定AI智能设计怎样自动生成电商Banner_稿定AI智能设计Banner生成流程【步骤】  百度浏览器ai助手怎么关闭 百度浏览器ai功能禁用  微信AI数字人如何设置工作时间_微信AI数字人时段开关与值班安排【实操】  途牛旅游AI怎样设置抢票提醒_途牛AI抢票提醒时间与频率设置【方法】  DeepSeek编程怎么用_DeepSeek编程使用方法详细指南【教程】  tofai登录入口官网 tofai网页版地址链接  LogMeIn Resolve:IT 运维知识库的 AI 赋能实践  如何用AI帮你检查代码中的潜在安全漏洞?  AI复古风照片编辑教程:Gemini AI轻松打造复古时尚  孩子作文写不出来?教你用AI引导孩子构思,写出优秀范文 

 2024-03-08

了解您产品搜索量及市场趋势,制定营销计划

同行竞争及网站分析保障您的广告效果

点击免费数据支持

提交您的需求,1小时内享受我们的专业解答。

南京市珐之弘网络技术有限公司


南京市珐之弘网络技术有限公司

南京市珐之弘网络技术有限公司专注海外推广十年,是谷歌推广.Facebook广告全球合作伙伴,我们精英化的技术团队为企业提供谷歌海外推广+外贸网站建设+网站维护运营+Google SEO优化+社交营销为您提供一站式海外营销服务。

 87067657

 13565296790

 87067657@qq.com

Notice

We and selected third parties use cookies or similar technologies for technical purposes and, with your consent, for other purposes as specified in the cookie policy.
You can consent to the use of such technologies by closing this notice, by interacting with any link or button outside of this notice or by continuing to browse otherwise.