Meta FAIR 和 Samaya AI 团队利用 AI 提高维基百科的可验证性


☞☞☞AI 智能聊天, 问答助手, AI 智能搜索, 免费无限量使用 DeepSeek R1 模型☜☜☜

编辑 | 白菜叶

可验证性是维基百科的核心内容政策:声明需要有引用的支持。维护和提高维基百科参考文献的质量是一项重要的挑战,迫切需要更好的工具来帮助人类完成这项工作。

在这里,Samaya AI 和 Meta FAIR 的研究人员表明,可以借助由信息检索系统和语言模型提供支持的人工智能 (AI) 来解决改进参考的过程。

这种基于神经网络的系统(这里称之为 SIDE)可以识别不太可能支持其主张的维基百科引文,然后从网络上推荐更好的引文。该团队在现有的维基百科参考资料上训练这个模型,因此从数千名维基百科编辑的贡献和综合智慧中学习。通过众包,研究人员观察到,对于最有可能被该系统标记为无法验证的前 10% 的引用,与最初引用的参考文献相比,人们在 70% 的情况下更喜欢该系统提供的替代方案。

为了验证该系统的适用性,研究人员构建了一个演示来与英语维基百科社区互动,发现根据 SIDE 的说法,对于相同的前 10% 最有可能无法验证的声明,SIDE 的首次引用推荐的首选频率是现有维基百科引用的两倍。结果表明,基于人工智能的系统可以与人类一起使用,以提高维基百科的可验证性。

该研究以「Improving Wikipedia verifiability with AI」为题,于 2025 年 10 月 19 日发布在《Nature Machine Intelligence》。

维基百科是访问量最大的网站之一,每年的页面浏览量达到五万亿,是当今最重要的知识来源之一。因此,维基百科上的知识几乎都是可验证的,这一点至关重要:维基百科用户应该能够使用可靠的外部来源查找并确认维基百科上的声明。为了促进这一点,维基百科文章提供了指向支持该主张的背景材料的内联引用。质疑维基百科声明的读者可以遵循这些指示并自行验证信息。

然而,在实践中,这个过程可能会失败:引文可能并不包含受质疑的主张,或其来源可能值得怀疑。这样的说法可能仍然是正确的,但细心的读者无法轻易地用引用来源中的信息来验证它们。假设维基百科的说法是真实的,其验证过程分为两个阶段:(1)检查现有来源的一致性;(2)如果失败,则寻找新的证据。

如上所述,维基百科声明的验证需要对语言的深入理解和对在线搜索的掌握。机器可以在多大程度上学习这种行为?从基础人工智能进展的角度来看,这个问题很重要。例如,验证需要能够检测自然语言中的逻辑蕴涵,并将主张及其上下文转换为寻找证据的最佳搜索词——这两个长期存在的问题主要在某种程度上的综合环境中进行了研究。

从实际角度来看,这同样重要。机器验证器可以帮助维基百科编辑标记哪些引文可能会触发失败的验证,并建议用什么来替换引文,以防它们当前不支持各自的主张。这可能很重要:搜索潜在证据并仔细阅读搜索结果需要时间和大量的认知努力。将人工智能助手集成到这个过程中可能有助于减少这两种情况。

图示:SIDE概述。(来源:论文)

在最新的工作中,Samaya AI 和 Meta FAIR 的研究人员开发了 SIDE,一个基于人工智能的维基百科引文验证器。SIDE 在 Wikipedia 上发现根据当前引文可能无法验证的声明,为此,扫描网络快照以寻找替代方案。

它的行为是通过维基百科本身来学习的:使用精心策划的英语维基百科声明及其当前引用的语料库,研究人员训练(1)一个检索器组件,将声明和上下文转换为经过优化的符号和神经搜索查询,以在网络规模的语料库中查找候选引用;(2) 一个验证模型,根据现有的和检索到的引文验证给定声明的可能性进行排名。

该团队使用自动指标和人工注释来评估他们的模型。为了自动测量该系统的准确性,他们检查了 SIDE 在高质量文章中恢复现有维基百科引用的情况(如维基百科特色文章类所定义)。

研究人员发现,在近 50% 的情况下,SIDE 会准确返回维基百科中使用的源作为其最佳解决方案。值得注意的是,这并不意味着其他 50% 是错误的,只是他们不是当前的维基百科来源。

该团队还测试了 SIDE 作为引文助手的能力。在用户研究中,他们将现有的维基百科引用放在 SIDE 生成的引用旁边。然后,用户评估所提供的引文在多大程度上支持该主张,以及来自 SIDE 或维基百科的哪个引文更适合验证。

总体而言,超过 60% 的时间用户更喜欢 SIDE 的引用而不是维基百科的引用,当 SIDE 将非常低的验证分数与维基百科的引用相关联时,这一比例会增加到 80% 以上。

论文链接:https://www.nature.com/articles/s42256-023-00726-1


# 人工智能  # https  # 维基百科  # 很重要  # 多大  # 最有  # 英语  # 转换为  # 程度上  # 的是  # 都是  # 情况下 


相关栏目: 【 Google疑问12 】 【 Facebook疑问10 】 【 网络优化91478 】 【 技术知识72672 】 【 云计算0 】 【 GEO优化84317 】 【 优选文章0 】 【 营销推广36048 】 【 网络运营41350 】 【 案例网站102563 】 【 AI智能45237


相关推荐: 免费高效获客!ChatGPT助你快速生成潜在客户名单  Google Gemini 辅助进行 Android Studio 代码开发  AI UGC生成器深度测评:四大工具横向对比分析  智谱AI智能绘图怎么用_智谱AI智能绘图使用方法详细指南【教程】  AI电子书写作终极指南:ChatGPT和Canva实战教程  2025年AI图像生成指南:Google Gemini Nano Banana教程  图像分割技术详解:定义、类型、技术与应用  如何利用豆包 AI 快速查询当地生活服务资讯  AI如何一键生成PPT大纲_利用AI工具制作演示文稿方法【教程】  人脸识别的伦理困境:Massive Attack的演出引发的思考  lovemo官网网页版入口 lovemo官网登录入口  文心一言辅助进行行业深度研究报告撰写  文心一言辅助进行中文播客脚本起草教程  律师视角下的生成式AI:信息爆炸时代的法律实践与未来展望  深度学习姿态估计:技术、应用与未来趋势全解析  AI时代软件工程师如何破局?未来必备技能全解析  智行ai抢票怎么设置抢票截止时间_智行ai抢票截止时间设置与确认【步骤】  goPDF:AI驱动的PDF文档处理全方位指南,提升工作效率  Depseek能否生成领导汇报版总结_Depseek汇报版结构调整与精简技巧【教程】  Midjourney怎么用一键生成漫画_Midjourney漫画生成方法【攻略】  Claude怎么用新功能代码辅助_Claude代码辅助使用攻略【方法】  智行ai抢票如何绑定微信通知_智行ai抢票微信提醒绑定与推送设置【指南】  研究学者如何利用现有资源提升学术影响力  ChatGPT怎么生成短视频脚本_ChatGPT脚本生成方法【指南】  ChatGPT背后的AI革命:OpenAI的崛起与Google的危机  怎么使用网页版deepseek【教程】  Quizlet AI:学生提分神器,告别传统学习方式,效率倍增  tofai网页版官方入口 tofai官网登录网址  tofai官网入口链接 tofai网页版在线登录  豆包AI怎么查看个人主页_管理账号信息与偏好设置  豆包AI怎么生成员工成长总结_豆包AI成长指标提取与案例编写【方法】  AI 驱动的潜在客户生成:终极自动化指南  Guru知识管理平台:AI驱动的企业知识中心构建指南  教你用AI快速制作思维导图,3步理清所有工作思路  超频爱好者盛宴:液氮超频Xeon 28核处理器  面试成功秘诀:如何巧妙回答常见面试问题  Claude怎么用新功能故事创作_Claude故事创作使用【方法】  Artspace.ai: AI驱动的创意设计平台,提升小企业营销效率  利用ChatGPT掌控健康:AI赋能的医疗新时代  佐糖AI抠图如何免费使用_佐糖AI免费额度获取与消耗查看【指南】  千问怎样调整回答语气_千问语气设置亲切专业等【指南】  CanvaAI抠图能否保留透明图层_CanvaAI透明图层保留与导出设置【方法】  怎么用AI帮你设计一套个性化的手机App图标?  Sim.AI教程:构建智能客户支持助手  冷邮件营销新策略:工作坊模式助力B2B销售增长  Mac百度输入法ai怎么关 Mac版百度ai助手禁用教程  tofai官网正版入口 tofai网页版免费使用  医疗专家如何利用课程和内容赋能女性对抗癌症  OpenAI Codex最强攻略:提升AI编码效率的秘诀  AI伴侣:连接还是孤独?真实对话揭秘AI伦理困境 

 2023-10-24

了解您产品搜索量及市场趋势,制定营销计划

同行竞争及网站分析保障您的广告效果

点击免费数据支持

提交您的需求,1小时内享受我们的专业解答。

南京市珐之弘网络技术有限公司


南京市珐之弘网络技术有限公司

南京市珐之弘网络技术有限公司专注海外推广十年,是谷歌推广.Facebook广告全球合作伙伴,我们精英化的技术团队为企业提供谷歌海外推广+外贸网站建设+网站维护运营+Google SEO优化+社交营销为您提供一站式海外营销服务。

 87067657

 13565296790

 87067657@qq.com

Notice

We and selected third parties use cookies or similar technologies for technical purposes and, with your consent, for other purposes as specified in the cookie policy.
You can consent to the use of such technologies by closing this notice, by interacting with any link or button outside of this notice or by continuing to browse otherwise.