利用大型语言模型揭示隐藏因果关系的挑战与突破
因果关系的发现与分析是科学研究的核心,但现有的因果发现算法依赖于预先定义的高级变量,而这些变量在现实世界中往往匮乏。尤其对于图片、文本等高维非结构化数据,更是如此。香港浸会大学等机构的研究人员在NeurIPS 2025发表论文《Discovery of the Hidden World with Large Language Models》,提出了一种名为COAT的新型框架,旨在利用大型语言模型 (LLM) 来克服这一难题,从而更有效地识别现实世界中的因果关系。
论文链接:https://www./link/2fdddc426480d46ce18affae5e455c82
代码链接:https://www./link/5807f0ed140fffaa1f35f16baf72e31b
☞☞☞AI 智能聊天, 问答助手, AI 智能搜索, 免费无限量使用 DeepSeek R1 模型☜☜☜
研究背景
科学进步依赖于对关键变量及其因果关系的识别。传统的因果发现方法 (CDs) 依赖于人类专家提供的高质量变量,但在实际应用中,这些变量往往难以获得。例如,分析用户评分的电商卖家,只能获取用户评论等非结构化数据。因此,高级变量的匮乏限制了 CDs 方法的应用范围。
LLM 在理解非结构化数据方面展现出强大的能力,并能解决各种复杂任务。一些研究表明,LLM 可以回答因果问题,但现有方法主要将其作为因果变量的直接推理器,可靠性存疑,且缺乏对因果发现理论保证的充分讨论。因此,如何可靠地利用 LLM 揭示现实世界的因果机制成为一个关键问题。
COAT框架:LLM作为表征辅助工具
本研究的目标是利用 LLM 为非结构化数据构建结构化表征,该表征由一系列高级变量组成,能够捕捉目标信息并具有可解释性。为此,研究人员提出了 Causal representatiOn AssistanT (COAT) 框架。用户只需提供目标变量,COAT 就能迭代地寻找构成目标变量马尔可夫毯 (Markov Blanket) 的高级变量集。然后,任何合适的因果发现算法都可以用于进一步分析因果结构。
数据与目标
目标是找到一个映射函数,将非结构化数据 X 映射到高级变量集 h(X),从而构成 Y 的马尔可夫毯。
LLM 的作用:变量提出与取值解析
COAT 将映射函数分解为一系列高级变量,每个变量将原始观测映射到预定义的值空间。这些变量由 LLM 通过自然语言定义,并具有明确的物理含义。例如,“甜度”可以定义为:1 (满意),-1 (失望),0 (未提及/无法判断)。
COAT 框架包含以下步骤:
图1. COAT框架示例
图2. COAT变量提出环节Prompt示意
图3. COAT框架总结
理论分析与实验结果
研究人员定义了感知分数和能力分数来衡量 LLM 提出高级变量的能力。通过理论分析和在 AppleGastronome (美食家对苹果评分) 和 Neuropathic (神经性疼痛诊断) 两个数据集上的实验,结果表明:
图5. AppleGastronome数据样例
图6. AppleGastronome相关因果图
图7. AppleGastronome实验结果
图8. LLM相关能力实验评估
图9. LLM标注噪声独立性检验
图10. AppleGastronome数据集上COAT因果结构识别评估
图11. Neuropathic数据样例
图12. Neuropathic相关因果图
图13. Neuropathic实验结果
图14. COAT探究ENSO因果机制
结论与未来展望
COAT 框架有效地结合了 LLM 和因果发现方法的优势,能够处理非结构化数据,并为因果发现提供支持。这项研究为构建用于因果发现的强大基础模型开辟了新的方向。
引用信息
@inproceedings{causalcoat2025,
title={Discovery of the Hidden World wi
th Large Language Models}, author={Chenxi Liu and Yongqiang Chen and Tongliang Liu and Mingming Gong and James Cheng and Bo Han and Kun Zhang},year={2025},booktitle={Proceedings of the Thirty-eighth Annual Conference on Neural Information Processing Systems}}
# 因果关系
# 就能
# 自然语言
# 样例
# 这一
# 可夫
# 马尔
# 依赖于
# 提出了
# git
# 结构化
# prompt
# https
# 算法
# github
# 2025
# 苹果
相关栏目:
【
Google疑问12 】
【
Facebook疑问10 】
【
网络优化91478 】
【
技术知识72672 】
【
云计算0 】
【
GEO优化84317 】
【
优选文章0 】
【
营销推广36048 】
【
网络运营41350 】
【
案例网站102563 】
【
AI智能45237 】
相关推荐:
苹果手机百度ai怎么关 iPhone百度输入法ai关闭
Azure AI 文本分类指南:自定义模型,提高文本分析精度
提升阅读理解:策略、技巧和有效方法全面指南
ChatGPT官方入口 ChatGPT官网网页版访问步骤详解
Filmora 13 AI音乐生成器:创意视频配乐新纪元
软件测试进化史:从手动到AI,迎接测试新纪元
智谱AI绘画怎么用_智谱AI绘画使用方法详细指南【教程】
AI末日预言?智能聊天机器人真的能替代信仰吗?
2025年最佳AI时间管理软件:Motion、Reclaim AI与Clockwise终极评测
智谱AI创意设计怎么用_智谱AI创意设计使用方法详细指南【教程】
专家:26年1月中国车市将实现“开门红” 高端增长强劲
钉钉ai划词工具怎样查看划词历史_钉钉ai划词工具历史记录查询【指南】
播客数据深度分析:用户地域分布及增长策略探讨
如何用AI帮你制定个人OKR?目标管理从未如此简单
千问能否生成多语言年终总结_千问多语言翻译与本地化调整【攻略】
AI Buildr: 构建 AI 应用的终极指南
ChatGPT一键生成PPT怎么加目录_ChatGPTPPT目录添加【步骤】
股票 vs. ETF:解锁股市财富密码,新手投资完全指南
通义万相做海报怎么用_通义万相做海报使用方法详细指南【教程】
Gemini怎样写实用型提示词_Gemini实用提示词编写【攻略】
Google AI Studio 中的提示词微调实验教程
DeepSeek辅助撰写专利申请 DeepSeek技术创新文档写作
PandaDoc vs. SignEasy: 2025 eSignature 平台终极对比
探索都市传说:追寻鳄鱼飞机怪物“Bombardino Crocodilo”
ClickUp AI Agents:项目管理的革命性突破
批改网AI检测工具如何对接学校系统_批改网AI检测工具系统对接与数据同步【步骤】
夸克AI能否查快递物流_夸克AI快递查询入口与单号输入【步骤】
MagicAnimate怎么让图片动起来 字节跳动MagicAnimate配置及用法【教程】
Google Gemini 对复杂物理解题过程的逐步解析
PlotDot Horizon:AI编剧工具颠覆好莱坞?深度评测
智谱AI内容创作怎么用_智谱AI内容创作使用方法详细指南【教程】
3步教你用AI自动分类文件,整理电脑告别杂乱
5分钟教你用AI将任何文章改写成儿童易懂版
途牛旅游AI怎样设置抢票提醒_途牛AI抢票提醒时间与频率设置【方法】
AI电商网站搭建:CSV到WooCommerce全流程指南
怎么用ai做证件照换底色 AI一键抠图与背景色替换【方法】
稿定设计AI抠图怎样调整透明度_稿定设计AI透明度滑块与渐变设置【攻略】
讯飞星火怎么一键生成|直播|话术_讯飞星火话术生成与节奏把控【教程】
SmartEbook AI:下一代电子书创作工具,轻松实现被动收入
AI绘图软件怎么用_AI绘图软件使用方法详细指南【教程】
AI图像生成偏见:克服与优化,打造更真实的数字形象
百度AI搜索如何开启无痕搜索_百度AI搜索无痕模式设置与隐私保护【攻略】
千问怎样生成年度业绩分析_千问业绩分析模型与数据解读【攻略】
SEO已死?重塑品牌线上可见性的新策略
文心一言 4.0 在公文写作规范中的实战技巧
豆包AI怎么评价回答的好坏_点赞与反馈功能使用教程
旅游营销AI:ChatGPT邮件营销策略,提升旅游业务转化率
3步教你用AI将你的博客文章改编成引人入胜的播客脚本
ChatGPT写论文大纲教程 辅助学术构思与资料检索操作方法
lumen5怎样从新闻稿生成社交视频_Lumen5新闻稿转社交视频步骤【社媒】
2025-02-09
南京市珐之弘网络技术有限公司专注海外推广十年,是谷歌推广.Facebook广告全球合作伙伴,我们精英化的技术团队为企业提供谷歌海外推广+外贸网站建设+网站维护运营+Google SEO优化+社交营销为您提供一站式海外营销服务。