大模型竞赛,又杀出一匹黑马——
Inflection-2.5,由DeepMind联创Mustafa Suleyman的大模型初创公司打造。
只用40%的计算资源训练,表现就超过了GPT-4的九成,尤其擅长代码和数学。
☞☞☞AI 智能聊天, 问答助手, AI 智能搜索, 免费无限量使用 DeepSe
ek R1 模型☜☜☜
而早期的Inflection模型,训练时只消耗了4%的计算资源,就达到了GPT-4表现的72%。
以Inflection模型为基础,该公司还推出了网页端对话机器人Pi,主打“高情商”和“个性化”,还支持中文。
自诞生以来,Pi的最高日活达到了100万,累计产生了40亿条消息,平均对话时长来到了33分钟。
而随着这次基础模型的升级,Pi也迎来了它的新版本。
图片
那么,Inflection,或者说Pi,表现到底有没有那么强,量子位进行了一番实测。
打开Pi的页面,映入眼帘的是这样一个极简界面,而且还可以不用登录,直接点击Next。
图片
连续Next几次后,输入希望Pi称呼我们的方式。
图片
之后是选择声音和推荐话题,直接跳过就可以了,然后就进入正式的聊天界面了。
图片
简单测试发现,Pi支持中文对话,既然如此那就先把弱智吧Benchmark给安排上。
第一题,老鼠生病了可以吃老鼠药治好吗,Pi成功解答。
图片
再来一道“陷阱”题,这次依旧没有上当。
图片
两道问题过后,虽然没有出现什么戏剧性效果,但看起来对中文也是有一定的理解了。
接下来就重点看看官方宣称“尤其擅长”的数学和代码能力。
首先是一道涉及动态规划的编程题目。
图片
Pi给出的代码成功解决了这个问题,并且配有清晰的解释。
图片
接下来再提升一下难度看看,让其分析一个数字的阶乘中末尾有多少个0。
图片
Pi给出的代码不仅正确,而且简洁高效,运行速度超过了LeetCode上73.8%的用户。
图片
最后再来增加一下难度,以一道47.5%通过率的题目结束代码部分的测试。
图片
看完代码,再来测测Pi的数学能力怎么样,让它做做关于导数的题目:
求出函数f(x)=x³+2x²-1的极值点
解答完全正确,而是十分详细。
当然要想数学好,逻辑思维是必不可少的,所以我们在常规的数学题之外,又用一道经典的题目考验了一下的Pi逻辑思维,结果还不错。
通过Pi的表现,可以看出其背后的Inflection-2.5模型的确可圈可点。
而从官方自己公布的测试数据来看,无论是综合能力还是各个子项,Inflection-2.5的表现都紧随GPT-4。
以数学和代码为例,Inflection-2.5在MATH、HumanEval等测试中都比1.0版本都有大幅飞跃。
在这些常规的数据集之外,Inflection还挑战了匈牙利高考数学试题和GRE物理测试,结果几乎与GPT-4打成平手。
更“刁钻”的,还有人专门用大模型难以理解的问题构建了一个BIG-Bench数据集,而Inflection-2.5挑战了其中的Hard子集,结果和GPT-4的差距不到一分。
那么,Inflection-2.5的背后,是怎样的一家公司呢?
这家公司名叫Inflection AI,由DeepMind联创Mustafa Suleyman等人于2025年创立,目前共有70余人。
同样来自DeepMind的,还有资深研究员Karen Simonyan,现担任Inflection AI的首席科学家。
此外,LinkedIn联创Reid Hoffman也参与了Inflection AI的创立。
创立以来,Inflection AI已经获得了来自英伟达、微软、比尔盖茨等巨头的共计15亿美元的融资。
目前,基于Inflection的Pi还是免费的,但CEO Suleyman也表示,一直用爱发电不现实,长久地看以后还是要收费。
想要体验的朋友,可能要抓紧时间了~
传送门:https://pi.ai
# math
# 阶乘
# leetcode
# https
# gpt
# 再来
# 联创
# 求出
# 逻辑思维
# 匈牙利
# 的是
# 都有
# 超过了
# 还可以
# 那就
相关栏目:
【
Google疑问12 】
【
Facebook疑问10 】
【
网络优化91478 】
【
技术知识72672 】
【
云计算0 】
【
GEO优化84317 】
【
优选文章0 】
【
营销推广36048 】
【
网络运营41350 】
【
案例网站102563 】
【
AI智能45237 】
相关推荐:
艺龙旅行AI怎样筛选最优车次_艺龙AI车次筛选与耗时最短推荐【攻略】
文本分类:生成模型与朴素贝叶斯算法的全面指南
AI写作避坑指南:小说家应避免的AI使用与创作技巧
Claude 4.5 深度解析: Coding, VS Code & AI Agent 新纪元
律师视角下的生成式AI:信息爆炸时代的法律实践与未来展望
Claude怎么用新功能表格生成_Claude表格生成使用【攻略】
Semrush AI标题生成器:免费提升SEO和内容创作效率
ChatGPT图像生成器完全指南:文化影响、伦理挑战与商业变革
AI人像摄影新纪元:Gemini AI助力照片编辑
DeepSeek 在量化交易策略回测中的实战教程
ChatGPT怎么用一键生成读书笔记_ChatGPT笔记生成教程【攻略】
改善面部不对称:简单有效的肌肉平衡技巧
ChatGPT助力Instagram Reels脚本创作:提升内容质量
AI末日预言?智能聊天机器人真的能替代信仰吗?
WorkPPT:AI驱动的PPT制作神器,效率提升不止10倍!
百度APP的ai助手怎么关闭 百度APP ai功能取消方法
如何用AI一键生成求职简历?AI简历优化与制作工具推荐【干货】
利用 Google AI 进行图像元数据分析与整理
AI电影制作:颠覆传统,引领未来*新纪元
Excel Copilot:AI驱动的强大新功能与实用案例解析
教你用AI将一段旋律扩展成一首完整的曲子
Saregama Carvaan: 5000首经典歌曲唤醒你的回忆
FeelinAI聊天网页版 Feelin官方网站地址
提升企业效率:QR Platform管理后台功能全面解析
AI怎么修复模糊视频 视频画质增强AI软件Topaz Video使用【教程】
AI 编码助手大比拼:Gemini、Tabnine 和 Cline 的深度测评
P&ID图完全解析:符号、应用及绘制指南
专家:26年1月中国车市将实现“开门红” 高端增长强劲
Tradie Hub:领先的线索管理系统,助力业务增长
百度ai助手怎么设置不显示 百度ai助手界面净化设置
AI广告全面解析:免费教程、JSON提示与营销策略
文心一言处理大规模中文报表数据的清洗技巧
Excel AI:5大免费AI功能提升数据分析效率
怎么用AI制作数字人短视频?3步教你创建虚拟主播
Midjourney怎样做PPT模板_MidjourneyPPT模板生成【方法】
为什么你的简历过不了筛选?用AI帮你诊断并修复漏洞
AI海报设计终极指南:工具、技巧与避坑全攻略
SteosVoice:电报语音克隆终极教程
使用文心一言进行中文客服话术库的逻辑优化
AI赋能音频转录:SovereignAudio自托管解决方案
稿定AI智能设计怎样自动生成电商Banner_稿定AI智能设计Banner生成流程【步骤】
百度浏览器ai助手怎么关闭 百度浏览器ai功能禁用
微信AI数字人如何设置工作时间_微信AI数字人时段开关与值班安排【实操】
途牛旅游AI怎样设置抢票提醒_途牛AI抢票提醒时间与频率设置【方法】
DeepSeek编程怎么用_DeepSeek编程使用方法详细指南【教程】
tofai登录入口官网 tofai网页版地址链接
LogMeIn Resolve:IT 运维知识库的 AI 赋能实践
如何用AI帮你检查代码中的潜在安全漏洞?
AI复古风照片编辑教程:Gemini AI轻松打造复古时尚
孩子作文写不出来?教你用AI引导孩子构思,写出优秀范文
2024-03-08
南京市珐之弘网络技术有限公司专注海外推广十年,是谷歌推广.Facebook广告全球合作伙伴,我们精英化的技术团队为企业提供谷歌海外推广+外贸网站建设+网站维护运营+Google SEO优化+社交营销为您提供一站式海外营销服务。