ICLR 2025 Oral | 应对随时间变化的分布偏移,西安大略大学等提出学习时序轨迹方法


AIxiv专栏是本站发布学术、技术内容的栏目。过去数年,本站AIxiv专栏接收报道了2000多篇内容,覆盖全球各大高校与企业的顶级实验室,有效促进了学术交流与传播。如果您有优秀的工作想要分享,欢迎投稿或者联系报道。投稿邮箱:liyazhou@jiqizhixin.com;zhaoyunfeng@jiqizhixin.com

作者曾秋琳,毕业于哈尔滨工业大学,硕士毕业于新加坡国立大学。在王博授和凌晓峰院士的指导下,博士期间主要围绕随机时间变化的分布问题展开理论论证、方法和应用的研究。目前已在iclr/aaai/ieee tnnls发表多篇学术论文。

个人主页:https://hardworkingpearl.github.io/

在现实世界的机器学习应用中,随时间变化的分布偏移是常见的问题。这种情况被构建为时变域泛化(EDG),目标是通过学习跨领域的潜在演变模式,并利用这些模式,使模型能够在时间变化系统中对未见目标域进行良好的泛化。然而,由于 EDG 数据集中时间戳的数量有限,现有方法在捕获演变动态和避免对稀疏时间戳的过拟合方面遇到了挑战,这限制了它们对新任务的泛化和适应性。

为了解决这个问题,我们提出了一种新的方法 SDE-EDG,它通过连续插值样本收集数据分布的无限细分网格演变轨迹(IFGET),以克服过拟合的问题。此外,通过利用随机微分方程(SDEs)捕获连续轨迹的固有能力,我们提出了将 SDE 建模的轨迹通过最大似然估计与 IFGET 的轨迹对齐,从而实现捕获分布演变趋势。

☞☞☞AI 智能聊天, 问答助手, AI 智能搜索, 免费无限量使用 DeepSeek R1 模型☜☜☜

  • 论文标题:Latent Trajectory Learning for Limited Timestamps under Distribution Shift over Time

  • 论文链接:https://openreview.net/pdf?id=bTMMNT7IdW

  • 项目链接:https://github.com/HardworkingPearl/SDE-EDG-iclr2025

方法

核心思想

为了克服这一挑战,SDE-EDG 提出了一种新颖的方法,通过构建无限细分网格演变轨迹(Infinitely Fined-Grid Evolving Trajectory, IFGET),在潜在表示空间中创建连续插值样本,以弥合时间戳之间的间隔。此外,SDE-EDG 利用随机微分方程(Stochastic Differential Equations, SDEs)的内在能力来捕捉连续的轨迹动态,通过路径对齐正则化器将 SDE 建模的轨迹与 IFGET 对齐,从而实现跨域捕获演变分布趋势。

方法细节

1. 构建 IFGET:

首先,SDE-EDG 在潜在表示空间中为每个样本建立样本到样本的对应关系,收集每个个体样本的演变轨迹。对于时刻的每个类别 k 的任一样本,我们搜索时刻在特征空间离其最近的为其在的对应样本:

这里是计算两个向量之间的距离,是从下个领域采样的个样本的集合。

然后,利用这种对应关系生成连续插值样本,旨在连接时间戳间隔之间的时间间隙,避免对稀疏时间戳的过拟合,

这里采样自 Beta 分布。通过收集通过以上方式产生的样本的时序轨迹,我们得到 IFGET。

2. 使用 SDE 建模轨迹:

SDE-EDG 采用神经 SDE 来模拟数据在潜在空间中的连续时间轨迹。与传统的基于离散时间戳的模型不同, SDE 天然适合于模拟连续的时间轨迹。SDE-EDG 建模了时序轨迹,可以通过时刻的样本预测任意未来时刻的样本:

这里特征空间变量是由时刻的样本预测得到,是 drift function,是 diffusion function。

3. 路径对齐与最大似然估计:

SDE-EDG 通过最大化 IFGET 的似然估计来训练模型,

最终训练函数是,第一项是预测分类任务误差损失函数。

4. 实验

  • 下表展示了 SDE-EDG 与其他基线方法在多个数据集上分类准确率的比较。这些数据集包括 Rotated Gaussian (RG), Circle (Cir), Rotated MNIST (RM), Portraits (Por), Caltran (Cal), PowerSupply (PS), 和 Ocular Disease (OD)。结果显示,SDE-EDG 在所有数据集上的平均准确率均优于其他方法。

  • 下图提供了一个直观的比较,展示了 SDE-EDG 算法(左)与传统 DG 方法 IRM(右)在特征表示方面的差异。通过数据特征空间的可视化,我们可以观察到 SDE-EDG 学习到的特征表示具有明显的决策边界,其中不同类别的数据点被清晰地区分开来,以不同形状表示,并且不同域的数据以彩虹条的颜色区分。这表明 SDE-EDG 能够成功捕捉数据随时间演变的动态,并在特征空间中保持类别的可分性。相比之下,IRM 的特征表示则倾向于将数据点坍缩到单一方向,导致决策边界不明显,这反映出 IRM 在捕捉时变分布趋势方面的不足。

  • 下图通过一系列子图深入展示了 SDE-EDG 算法在捕捉数据随时间演变的能力方面的优势。子图 (a) 提供了 Sine 数据集的真实标签分布,其中正例和负例用不同颜色的点表示,为后续的比较提供了基准。接着,子图 (b) 和 (c) 分别展示了基于 ERM 的传统方法和 SDE-EDG 算法对同一数据集的预测结果,通过对比可以看出 SDE-EDG 在捕捉数据演变模式上的明显优势。子图 (d) 和 (e) 进一步揭示了 SDE-EDG 学习到的演变路径,其中 (d) 展示了应用了路径对齐损失(最大似然损失函数)后的路径,而 (e) 展示了未应用该损失时的路径。通过这一对比,可以直观地看到路径对齐损失对于确保模型能够正确捕捉和表征数据随时间变化的重要性。

  • 下图子图 (a) 展示了在 Portraits 数据集上,使用不同算法进行训练时的准确率收敛轨迹。这个子图提供了一个直观的视角,用以比较 SDE-EDG 算法与其他基线方法(如 ERM、MLDG、GI)在训练过程中性能的变化情况。通过观察训练准确率随时间推移的增长趋势,我们可以评估不同算法的学习能力和收敛速度。SDE-EDG 算法的收敛轨迹尤其值得关注,因为它揭示了该算法在适应不断演变的数据分布时的效率和稳定性。

    下图子图 (b) 和 (c) 分别展示了 RMNIST 和 Circle 数据集上,SDE-EDG 算法在这些数据集上的表现显示出其在处理时变分布时的优越性,即使在面对较大时间跨度的目标域时,也能保持较高的准确率,这表明了 SDE-EDG 算法在捕捉和适应数据演变模式方面的强大能力。

    下图子图 (d) 和 (e) 探讨了最大似然损失(Maximum Likelihood Loss)在 RMNIST 和 PowerSupply 数据集上对 SDE-EDG 性能的影响。通过改变正则化权重 α 的值,这两个子图展示了不同 α 设置对模型性能的具体影响。实验结果表明,适当的 α 值可以显著提高 SDE-EDG 在特定数据集上的性能,这强调了在实际应用中根据数据集特性和任务需求调整超参数的重要性。

结论

论文作者提出了一种新的 SDE-EDG 方法,用于建模时变域泛化(EDG)问题。方法涉及通过识别样本到样本的对应关系并生成连续插值样本来构建 IFGET。随后,作者采用随机微分方程(SDE)并将其与 IFGET 对齐进行训练。文章的贡献在于揭示了通过收集个体的时间轨迹来捕获演变模式的重要性,以及在时间间隔之间进行插值以减轻源时间戳数量有限的问题,这有效地防止了 SDE-EDG 对有限时间戳的过拟合。


# git  # for  # function  # github  # 算法  # https  # 展示了  # 提出了  # 微分方程  # 插值  # 这一  # 我们可以  # 揭示了  # 多篇  # 数年  # 与其他 


相关栏目: 【 Google疑问12 】 【 Facebook疑问10 】 【 网络优化91478 】 【 技术知识72672 】 【 云计算0 】 【 GEO优化84317 】 【 优选文章0 】 【 营销推广36048 】 【 网络运营41350 】 【 案例网站102563 】 【 AI智能45237


相关推荐: Replika AI:情感慰藉还是虚拟危机?深度剖析与用户反馈  C3.ai深度解析:投资者必知的关键洞察  Claude如何导出对话记录_Claude对话导出方法【方法】  AI 和 Plagiarism Checker:SEO 内容创作的终极指南  tofai官网入口链接 tofai网页版在线登录  雷小兔ai智能写作怎么设置写作风格_雷小兔ai智能写作风格选择方法【指南】  百度ai助手任务栏怎么关 百度ai助手任务栏图标隐藏  探索弦乐器世界:从吉他到卡曼切,乐器全解析  乐高积木重现约拿的故事:圣经故事趣味解读  Beats to Rap On AI Stem Splitter:终极音乐创作工具  Cred.ai信用卡深度评测:信用提升的秘密武器  批改网ai检测工具怎样生成改进建议_批改网ai检测工具改进建议查看与应用【攻略】  如何用 ChatGPT 批量处理 Excel 复杂公式  使用 ChatGPT 构建自动化 SEO 关键词库  Speerise亮面体操服测评:舒适与时尚的完美结合  宠物翻译App评测:与猫狗交流的未来科技?  掌握这几个AI提问技巧,帮你出个性化的求职信  啦啦队女孩:青春活力与性感魅力的完美结合  雷小兔ai智能写作怎样导入素材_雷小兔ai智能写作素材上传与引用【技巧】  Pearson AI学习工具:高效提升你的数学学习效率  批改网AI检测工具怎样优化检测精度_批改网AI检测工具精度调节与模型选择【实操】  如何用ChatGPT准备面试 模拟面试问答与职场话术练习教程  AI复古风照片编辑教程:Gemini AI轻松打造复古时尚  Semrush Summary Generator: 高效总结长篇文章的终极指南  Amazon Rekognition: 图像与视频分析的强大AI工具  2025年最佳AI流程图工具:效率提升秘籍  打造AI Jarvis:停止功能、联网、中文与人脸集成  Foocus:免费AI图像生成器终极指南及 OnlyFans 替代方案  腾讯混元图像3.0上线LiblibAI,80B参数助力创作者高效出图  Hugging Face Transformers:文本分类的完整指南  Azure AI 文本分类指南:自定义模型,提高文本分析精度  利用 DeepSeek 提高敏捷开发中的 Sprint 规划效率  AI超级英雄大乱斗:蜘蛛侠、死侍的爆笑奇幻之旅  Jetson SegNet: 语义分割深度探索与实践  AI电子书创作革命:AieBookSuite如何颠覆出版行业  面试必胜:五大面试技巧助你斩获Offer  免费AI头像生成终极指南:逼真、个性化、无水印  Tamilnad Mercantile Bank TMB:如何在线下载账户报表  CanvaAI抠图能否保留透明图层_CanvaAI透明图层保留与导出设置【方法】  AI图片生成教程:轻松打造你的专属文化艺术照  《高龄母亲》:从日本民间故事中汲取的人生智慧与家庭真谛  优化《现代战争2》色彩:提升游戏视觉体验终极指南  夸克AI能否查快递物流_夸克AI快递查询入口与单号输入【步骤】  如何用AI帮你设计调查问卷?科学提问,精准收集反馈  AI赋能项目管理:5个实用技巧提升效率  2025年AI图像生成指南:Google Gemini Nano Banana教程  LTX Studio:AI电影制作平台深度评测与应用指南  Gemini 与 Google Drive 结合的文件智能检索  Mootion AI视频生成器:一键创作动画故事!  EdrawMax AI:项目管理和创意专业人士的终极图表工具 

 2024-06-20

了解您产品搜索量及市场趋势,制定营销计划

同行竞争及网站分析保障您的广告效果

点击免费数据支持

提交您的需求,1小时内享受我们的专业解答。

南京市珐之弘网络技术有限公司


南京市珐之弘网络技术有限公司

南京市珐之弘网络技术有限公司专注海外推广十年,是谷歌推广.Facebook广告全球合作伙伴,我们精英化的技术团队为企业提供谷歌海外推广+外贸网站建设+网站维护运营+Google SEO优化+社交营销为您提供一站式海外营销服务。

 87067657

 13565296790

 87067657@qq.com

Notice

We and selected third parties use cookies or similar technologies for technical purposes and, with your consent, for other purposes as specified in the cookie policy.
You can consent to the use of such technologies by closing this notice, by interacting with any link or button outside of this notice or by continuing to browse otherwise.