NeurIPS 2025 | 用LLM探寻隐秘的因果世界


利用大型语言模型揭示隐藏因果关系的挑战与突破

因果关系的发现与分析是科学研究的核心,但现有的因果发现算法依赖于预先定义的高级变量,而这些变量在现实世界中往往匮乏。尤其对于图片、文本等高维非结构化数据,更是如此。香港浸会大学等机构的研究人员在NeurIPS 2025发表论文《Discovery of the Hidden World with Large Language Models》,提出了一种名为COAT的新型框架,旨在利用大型语言模型 (LLM) 来克服这一难题,从而更有效地识别现实世界中的因果关系。

论文链接:https://www./link/2fdddc426480d46ce18affae5e455c82

代码链接:https://www./link/5807f0ed140fffaa1f35f16baf72e31b

☞☞☞AI 智能聊天, 问答助手, AI 智能搜索, 免费无限量使用 DeepSeek R1 模型☜☜☜

研究背景

科学进步依赖于对关键变量及其因果关系的识别。传统的因果发现方法 (CDs) 依赖于人类专家提供的高质量变量,但在实际应用中,这些变量往往难以获得。例如,分析用户评分的电商卖家,只能获取用户评论等非结构化数据。因此,高级变量的匮乏限制了 CDs 方法的应用范围。

LLM 在理解非结构化数据方面展现出强大的能力,并能解决各种复杂任务。一些研究表明,LLM 可以回答因果问题,但现有方法主要将其作为因果变量的直接推理器,可靠性存疑,且缺乏对因果发现理论保证的充分讨论。因此,如何可靠地利用 LLM 揭示现实世界的因果机制成为一个关键问题。

COAT框架:LLM作为表征辅助工具

本研究的目标是利用 LLM 为非结构化数据构建结构化表征,该表征由一系列高级变量组成,能够捕捉目标信息并具有可解释性。为此,研究人员提出了 Causal representatiOn AssistanT (COAT) 框架。用户只需提供目标变量,COAT 就能迭代地寻找构成目标变量马尔可夫毯 (Markov Blanket) 的高级变量集。然后,任何合适的因果发现算法都可以用于进一步分析因果结构。

数据与目标

  • 目标变量 (Y): 例如,消费者对产品的评分或患者的疾病类型。
  • 非结构化数据 (X): 例如,用户评论或医学图像。
  • 数据集: 由 (X, Y) 样本组成。

目标是找到一个映射函数,将非结构化数据 X 映射到高级变量集 h(X),从而构成 Y 的马尔可夫毯。

LLM 的作用:变量提出与取值解析

COAT 将映射函数分解为一系列高级变量,每个变量将原始观测映射到预定义的值空间。这些变量由 LLM 通过自然语言定义,并具有明确的物理含义。例如,“甜度”可以定义为:1 (满意),-1 (失望),0 (未提及/无法判断)。

COAT 框架包含以下步骤:

  1. 变量提出: 使用 LLM 根据样本数据提出潜在的高级变量。
  2. 取值解析: 使用 LLM 为提出的高级变量解析所有样本的取值。
  3. 因果发现: 使用因果发现算法 (例如 FCI) 分析结构化数据,构建因果图。
  4. 反馈: 基于因果发现结果,构建反馈,引导 LLM 进一步寻找高级变量。

图1. COAT框架示例

图2. COAT变量提出环节Prompt示意

图3. COAT框架总结

理论分析与实验结果

研究人员定义了感知分数和能力分数来衡量 LLM 提出高级变量的能力。通过理论分析和在 AppleGastronome (美食家对苹果评分) 和 Neuropathic (神经性疼痛诊断) 两个数据集上的实验,结果表明:

  • COAT 能够有效识别高级变量并构建因果图。
  • COAT 的反馈机制能够有效提升变量识别能力。
  • 相比于直接使用 LLM 推理因果关系,COAT 能够获得更准确的结果。

图5. AppleGastronome数据样例

图6. AppleGastronome相关因果图

图7. AppleGastronome实验结果

图8. LLM相关能力实验评估

图9. LLM标注噪声独立性检验

图10. AppleGastronome数据集上COAT因果结构识别评估

图11. Neuropathic数据样例

图12. Neuropathic相关因果图

图13. Neuropathic实验结果

图14. COAT探究ENSO因果机制

结论与未来展望

COAT 框架有效地结合了 LLM 和因果发现方法的优势,能够处理非结构化数据,并为因果发现提供支持。这项研究为构建用于因果发现的强大基础模型开辟了新的方向。

引用信息

@inproceedings{causalcoat2025,
title={Discovery of the Hidden World with Large Language Models}, author={Chenxi Liu and Yongqiang Chen and Tongliang Liu and Mingming Gong and James Cheng and Bo Han and Kun Zhang},year={2025},booktitle={Proceedings of the Thirty-eighth Annual Conference on Neural Information Processing Systems}}


# 因果关系  # 就能  # 自然语言  # 样例  # 这一  # 可夫  # 马尔  # 依赖于  # 提出了  # git  # 结构化  # prompt  # https  # 算法  # github  # 2025  # 苹果 


相关栏目: 【 Google疑问12 】 【 Facebook疑问10 】 【 网络优化91478 】 【 技术知识72672 】 【 云计算0 】 【 GEO优化84317 】 【 优选文章0 】 【 营销推广36048 】 【 网络运营41350 】 【 案例网站102563 】 【 AI智能45237


相关推荐: 苹果手机百度ai怎么关 iPhone百度输入法ai关闭  Azure AI 文本分类指南:自定义模型,提高文本分析精度  提升阅读理解:策略、技巧和有效方法全面指南  ChatGPT官方入口 ChatGPT官网网页版访问步骤详解  Filmora 13 AI音乐生成器:创意视频配乐新纪元  软件测试进化史:从手动到AI,迎接测试新纪元  智谱AI绘画怎么用_智谱AI绘画使用方法详细指南【教程】  AI末日预言?智能聊天机器人真的能替代信仰吗?  2025年最佳AI时间管理软件:Motion、Reclaim AI与Clockwise终极评测  智谱AI创意设计怎么用_智谱AI创意设计使用方法详细指南【教程】  专家:26年1月中国车市将实现“开门红” 高端增长强劲  钉钉ai划词工具怎样查看划词历史_钉钉ai划词工具历史记录查询【指南】  播客数据深度分析:用户地域分布及增长策略探讨  如何用AI帮你制定个人OKR?目标管理从未如此简单  千问能否生成多语言年终总结_千问多语言翻译与本地化调整【攻略】  AI Buildr: 构建 AI 应用的终极指南  ChatGPT一键生成PPT怎么加目录_ChatGPTPPT目录添加【步骤】  股票 vs. ETF:解锁股市财富密码,新手投资完全指南  通义万相做海报怎么用_通义万相做海报使用方法详细指南【教程】  Gemini怎样写实用型提示词_Gemini实用提示词编写【攻略】  Google AI Studio 中的提示词微调实验教程  DeepSeek辅助撰写专利申请 DeepSeek技术创新文档写作  PandaDoc vs. SignEasy: 2025 eSignature 平台终极对比  探索都市传说:追寻鳄鱼飞机怪物“Bombardino Crocodilo”  ClickUp AI Agents:项目管理的革命性突破  批改网AI检测工具如何对接学校系统_批改网AI检测工具系统对接与数据同步【步骤】  夸克AI能否查快递物流_夸克AI快递查询入口与单号输入【步骤】  MagicAnimate怎么让图片动起来 字节跳动MagicAnimate配置及用法【教程】  Google Gemini 对复杂物理解题过程的逐步解析  PlotDot Horizon:AI编剧工具颠覆好莱坞?深度评测  智谱AI内容创作怎么用_智谱AI内容创作使用方法详细指南【教程】  3步教你用AI自动分类文件,整理电脑告别杂乱  5分钟教你用AI将任何文章改写成儿童易懂版  途牛旅游AI怎样设置抢票提醒_途牛AI抢票提醒时间与频率设置【方法】  AI电商网站搭建:CSV到WooCommerce全流程指南  怎么用ai做证件照换底色 AI一键抠图与背景色替换【方法】  稿定设计AI抠图怎样调整透明度_稿定设计AI透明度滑块与渐变设置【攻略】  讯飞星火怎么一键生成|直播|话术_讯飞星火话术生成与节奏把控【教程】  SmartEbook AI:下一代电子书创作工具,轻松实现被动收入  AI绘图软件怎么用_AI绘图软件使用方法详细指南【教程】  AI图像生成偏见:克服与优化,打造更真实的数字形象  百度AI搜索如何开启无痕搜索_百度AI搜索无痕模式设置与隐私保护【攻略】  千问怎样生成年度业绩分析_千问业绩分析模型与数据解读【攻略】  SEO已死?重塑品牌线上可见性的新策略  文心一言 4.0 在公文写作规范中的实战技巧  豆包AI怎么评价回答的好坏_点赞与反馈功能使用教程  旅游营销AI:ChatGPT邮件营销策略,提升旅游业务转化率  3步教你用AI将你的博客文章改编成引人入胜的播客脚本  ChatGPT写论文大纲教程 辅助学术构思与资料检索操作方法  lumen5怎样从新闻稿生成社交视频_Lumen5新闻稿转社交视频步骤【社媒】 

 2025-02-09

了解您产品搜索量及市场趋势,制定营销计划

同行竞争及网站分析保障您的广告效果

点击免费数据支持

提交您的需求,1小时内享受我们的专业解答。

南京市珐之弘网络技术有限公司


南京市珐之弘网络技术有限公司

南京市珐之弘网络技术有限公司专注海外推广十年,是谷歌推广.Facebook广告全球合作伙伴,我们精英化的技术团队为企业提供谷歌海外推广+外贸网站建设+网站维护运营+Google SEO优化+社交营销为您提供一站式海外营销服务。

 87067657

 13565296790

 87067657@qq.com

Notice

We and selected third parties use cookies or similar technologies for technical purposes and, with your consent, for other purposes as specified in the cookie policy.
You can consent to the use of such technologies by closing this notice, by interacting with any link or button outside of this notice or by continuing to browse otherwise.