GPT-4与LLM:微软团队探索科学发现的影响,涵盖5大科学领域的230页长文


☞☞☞AI 智能聊天, 问答助手, AI 智能搜索, 免费无限量使用 DeepSeek R1 模型☜☜☜

重写内容时,需要将原文用中文进行重写,不需要出现原始的英文句子

前不久,微软 DeepSpeed 团队启动了一个名为 DeepSpeed4Science 的新计划,旨在通过 AI 系统优化技术实现科学发现。

11月13日,微软团队在arXiv预印平台上发布了一篇名为《大型语言模型对科学发现的影响:使用GPT-4的初步研究》的文章

这篇文章的长度达到了 230 页

论文链接:https://arxiv.org/abs/2311.07361

近年来,自然语言处理领域的突破性进展在强大的大型语言模型(LLM)的出现中达到了顶峰,这些模型在众多领域展示了非凡的能力,包括自然语言的理解、生成和翻译,甚至扩展到语言处理之外的任务。

在本报告中,微软研究人员深入研究了 LLM 在科学发现/研究背景下的表现,重点关注最先进的语言模型 GPT-4。研究涵盖多个科学领域,包括药物发现、生物学、计算化学(DFT 和 MD)、材料设计和偏微分方程 (PDE)。

对于评估GPT-4的科学任务而言,它对于挖掘其在各个研究领域的潜力、验证特定领域的专业知识、加速科学进步、优化资源分配、指导未来模型开发和促进跨学科研究非常重要。探索的方法主要包括专家驱动的案例评估,这种评估方式可以提供定性见解,帮助模型理解复杂的科学概念和关系;同时也会偶尔进行基准测试,以定量评估模型解决明确定义的特定领域问题的能力

初步探索显示,GPT-4 在各种科学应用中具有巨大的潜力,展示了其处理复杂问题解决和知识整合任务的能力。研究人员对 GPT-4 在上述领域(如药物发现、生物学、计算化学、材料设计等)的性能进行了分析,强调了其优点和局限性。综合评估了 GPT-4 的知识基础、科学理解能力、科学数值计算能力以及各种科学预测能力

GPT-4 在生物学和材料设计方面具有广泛的领域知识,有助于满足特定要求。在药物发现等其他领域,GPT-4 展现出了强大的特性预测能力。然而,在计算化学和偏微分方程等研究领域,虽然 GPT-4 有望帮助研究人员进行预测和计算,但仍需要进一步努力来提高其准确性。尽管其功能令人印象深刻,但 GPT-4 仍可对定量计算任务进行改进,例如需要微调以提高准确性

研究人员希望这份报告能够为那些希望利用LLM进行科学研究和应用的研究人员和从业者,以及对推动特定领域自然语言处理感兴趣的人提供宝贵的资源。需要强调的是,LLM和大规模机器学习领域正在快速发展,未来几代的LLM可能具有本报告中未提及的其他功能。值得注意的是,LLM与专业科学工具和模型的整合以及基础科学模型的开发代表了两个有希望的研究方向

药物发现

药物发现是制药行业的重要组成部分,在推进医学科学方面发挥着至关重要的作用。药物发现涉及复杂的多学科过程,包括靶点识别、先导化合物优化和临床前测试,最终导致安全有效药物的开发。

GPT-4 在药物发现方面具有巨大的潜力,如加速发现过程、降低搜索和设计成本、增强创造力等。本章首先通过定性测试研究 GPT-4 对药物发现的知识,然后通过对多个关键任务的定量测试来研究其预测能力,包括药物-靶标相互作用/结合亲和力预测、分子性质预测和逆合成预测

重写后的内容: 第一个例子涉及生成给定药物名称的化学式、IUPAC名称和SMILES,这是将名称转化为药物的其他表示形式。以Afatinib作为输入药物。GPT-4成功输出了正确的化学式C24H25ClFN5O3和正确的IUPAC名称,这表明GPT-4知道Afatinib这种药物。然而,生成的SMILES并不正确。因此,研究人员给予了指导,让GPT-4重新生成SMILES。不幸的是,尽管明确要求GPT-4“注意每种原子类型的原子数量”并基于正确的IUPAC和化学式生成SMILES,但在几次实验中生成的SMILES序列仍然不正确

第一张图展示了药物名称和其他药物表示形式的翻译。(引自论文)

生物

在本章中,研究人员深入探讨了 GPT-4 在生物学研究领域的能力,主要关注其理解生物语言、利用内置生物知识进行推理的熟练程度,以及设计生物分子和生物实验。观察表明,GPT-4 通过展示其处理复杂生物语言、执行生物信息任务、甚至作为生物设计的科学助手的能力,展现出为生物学领域做出贡献的巨大潜力。GPT-4 对生物学概念的广泛掌握及其作为设计任务中的科学助手的巨大潜力凸显了其在推进生物学领域的重要作用。

首先评估了 GPT-4 处理生物序列序列符号和文本符号的能力。

研究人员要求 GPT-4 在生物序列及其文本符号之间进行转换:1)输出给定蛋白质序列的蛋白质名称。2) 输出给定名称的蛋白质序列。在执行每个任务之前,都会重新启动会话以防止信息泄露。结果表明,GPT-4 知道序列到文本符号转换的过程,但它不能自己直接查找(也称为 BLAST 序列)。同时,GPT-4 更喜欢生物序列的文本标记(包括蛋白质和 DNA,后者未显示)。当给出文本符号时,它提供了更丰富的信息,这可能是由于其设计理念。需要指出的是,还注意到,生成序列可能会导致 GPT-4 的灾难性行为。如下图所示,虽然 GPT-4 返回了正确的 UniProt ID,但在生成序列时遇到了困难。序列生成因尝试的几种不同提示而崩溃。

图 2:序列符号和文本符号之间的转换。(来源:论文)

计算化学

化学计算是一门跨学科的领域,它利用计算方法和技术来解决化学中的复杂问题。长期以来,化学计算一直是分子系统研究中不可或缺的工具,它不仅提供了对原子级相互作用的深入理解,还指导了实验工作的开展。化学计算在微观和宏观层面上对于分子结构、化学反应和物理现象的理解发挥着至关重要的作用

本章将重点研究GPT-4在计算化学领域中的功能。我们将探讨其在电子结构方法和分子动力学模拟方面的应用,并通过展示两个实际示例,来展示GPT-4在不同角度下的服务能力。总之,GPT-4能够以多种方式助力计算化学研究人员

研究从评估 GPT-4 解释量子化学和物理概念的能力开始。评估涵盖了该领域常用的方法,如密度泛函理论(DFT)和波函数理论(WFT)。

图 3:密度泛函理论的概念检验。(来源:论文)

在以上例子中,GPT-4 很好地理解了密度泛函理论、KohnSham 密度泛函理论和无轨道密度泛函理论的概念。

材料设计

在本章中,研究了 GPT-4 在材料设计领域的功能。研究人员设计了一套全面的任务,涵盖材料设计过程中的各个方面,从最初的概念化到随后的验证和合成。目标是评估 GPT-4 的专业知识及其在实际应用中生成有意义的见解和解决方案的能力。设计的任务涵盖各个方面,包括背景知识、设计原则、候选识别、候选结构生成、属性预测和合成条件预测。通过解决整个设计过程,目标是对 GPT-4 在材料设计方面的熟练程度进行整体评估,特别是对于结晶无机材料、有机聚合物以及金属有机框架 (MOF) 等更复杂的材料。

值得注意的是,评估主要侧重于对 GPT-4 在这一专业领域的能力进行定性评估,而只有在可行的情况下才能获得统计分数。

研究人员首先调查了当前固体电解质的分类方式,这些分类方式有不同的要求,例如根据一般化学和阴离子类型进行分类。此外,他们还要求提供基于这些分类标准的示例。如图4所示,所有的答案都是事实,并且大部分都是正确的。由于这些分类标准在文献中没有被很好地体现,因此GPT-4应该对化学的含义有一个相对清晰的理解

根据来源的论文,需要重写的内容是:图4:无机固体电解质的分类

偏微分方程

偏微分方程 (PDE) 是数学领域中一个重要且高度活跃的研究领域,在物理、工程、生物学和金融等各个学科中具有深远的应用。偏微分方程在建模和理解各种现象(从流体动力学和传热到电磁场和群体动力学)方面发挥着至关重要的作用。

在本章中,研究了 GPT-4 在偏微分方程的几个方面的技能:理解偏微分方程的基础知识、求解偏微分方程以及协助 AI 进行偏微分方程研究。研究人员在不同形式的 PDE 上评估模型,例如线性方程、非线性方程和随机 PDE。研究表明 GPT-4 能够以多种方式帮助研究人员。

第一个问题是关于偏微分方程的定义和形式,GPT-4 对偏微分方程提供了很好的解释,如图 5 所示。在用户的提示下,GPT-4 给出了偏微分方程的清晰概念以及线性或非线性、椭圆形、抛物线形或双曲形的类别。该领域的新手将从这些概念和分类中受益。

图 5:PDE 的基本概念介绍。(来源:论文)

未来展望

在这项研究中,我们探索了LLM在各个自然科学领域的能力和限制,并涵盖了各种任务。我们的主要目标是初步评估最先进的LLM GPT-4以及其对科学发现的潜力,并为各个领域的研究人员提供有价值的资源和工具

通过广泛的分析,研究强调了 GPT-4 在众多科学任务中的熟练程度,从文献综合到属性预测和代码生成。尽管其功能令人印象深刻,但必须认识到 GPT-4(以及类似的 LLM)的局限性,例如处理特定数据格式的挑战、响应的不一致以及偶尔的幻觉。

研究人员相信,该探索是理解和认识 GPT-4 在自然科学领域潜力的关键第一步。通过详细概述其优点和缺点,旨在帮助研究人员在将 GPT-4(或其他 LLM)纳入日常工作时做出明智的决定,确保最佳应用,同时注意其局限性。

此外,鼓励 GPT-4 和其他 LLM 的进一步探索和发展,旨在提高其科学发现能力。这可能涉及完善培训过程、合并特定领域的数据和架构,以及集成针对不同科学学科量身定制的专业技术。

随着人工智能领域的不断发展,像 GPT-4 这样复杂模型的集成将在加速科学研究和创新方面扮演越来越重要的角色

最后,研究总结了 LLM 在科学研究方面需要改进的方面,并讨论加强 LLM 或在此基础上推动科学突破的潜在方向。


# 架构  # 子类  # 人工智能  # https  # gpt  # 微分方程  # 的是  # 重写  # 很好  # 自然语言  # 微软  # 研究领域  # 都是  # 所示  # 至关重要 


相关栏目: 【 Google疑问12 】 【 Facebook疑问10 】 【 网络优化91478 】 【 技术知识72672 】 【 云计算0 】 【 GEO优化84317 】 【 优选文章0 】 【 营销推广36048 】 【 网络运营41350 】 【 案例网站102563 】 【 AI智能45237


相关推荐: 提升效率:使用AI代理自动生成视频标题的实用指南  千问怎样生成年度业绩分析_千问业绩分析模型与数据解读【攻略】  宝可梦化石精灵大揭秘:晶灿钻石视角下的精灵演化  普通人如何用豆包AI月入过万?2026最新内容创作变现全攻略!  Google Gemini 在跨境电商选品分析中的实战  豆包AI怎么生成员工成长总结_豆包AI成长指标提取与案例编写【方法】  Quizlet AI:学生提分神器,告别传统学习方式,效率倍增  使用Autogen框架进行业务分析和执行报告生成  钉钉ai划词工具怎么使用划词查词_钉钉ai划词工具查词入口与释义查看【指南】  百度AI搜索如何开启无痕搜索_百度AI搜索无痕模式设置与隐私保护【攻略】  宝可梦朱紫:如何高效刷闪异色宝可梦,提升游戏体验  畅游长崎:寻找宝可梦与樱花的浪漫之旅  Mootion AI视频生成器:一键创作动画故事!  CanvaAI抠图能否保留透明图层_CanvaAI透明图层保留与导出设置【方法】  GitHub Copilot终极指南:提升代码效率与质量  批改网AI检测工具怎么生成评分报告_批改网AI检测工具报告生成与维度解读【指南】  tofai怎么调整层级顺序 tofai图层上下移动方法【步骤】  ChatGPT助力QA测试:提升效率与质量的终极指南  重温经典:宝可梦动画中的精彩瞬间与幕后花絮  AI赋能招聘:高级策略助你领先猎头行业  Google Gemini 处理结构化 XML 数据转换教程  数据迁移测试指南:策略、技术与挑战全解析  AI赋能软件测试:自动化、智能化与未来趋势  AI营销赋能本地服务:从Facebook广告到客户终身价值提升策略  Tradie Hub:领先的线索管理系统,助力业务增长  探索心灵的音乐之旅:Kanwar Garewal的《Ishq Bulleh Nu》  Cred.ai信用卡深度评测:信用提升的秘密武器  教你用AI一键为代码添加注释,小白也能读懂复杂程序  Codova AI:终极动态QR码生成器教程与功能详解  批改网ai检测工具如何导出检测报告_批改网ai检测工具报告导出格式【步骤】  网络安全警钟:揭秘“美足”背后隐藏的危机与防范  通义万相做小红书配图怎么用_通义万相做小红书配图使用方法详细指南【教程】  AI赋能保险销售:提升邮件营销效果的终极指南  Midjourney怎样生成网页_Midjourney生成网页教程【方法】  DeepSeek 在量化交易策略回测中的实战教程  颠覆认知!《小丑回魂》幕后:用爆笑台词颠覆你的恐怖想象  探索未来:AI机器人AURORA揭秘亚特兰蒂斯之谜  Motion 教程:AI 驱动的智能日程安排,提高工作效率  CanvaAI抠图如何换背景_CanvaAI背景替换与设计模板结合【攻略】  利用 Gemini 1.5 Pro 进行超长视频摘要提取  啦啦队女孩:青春活力与性感魅力的完美结合  ChatGPT怎样用提示词设上下文_ChatGPT上下文设置技巧【方法】  AI婴儿播客视频制作终极指南:免费工具与步骤  锂提取AI工具:地热数据分析与机器学习建模深度解析  小型邮件列表的终极指南:使用AI最大化营销效果  Google AI Studio:免费AI视频生成器使用指南  怎么用ai写产品说明书 AI功能介绍与使用步骤详解【实操】  易企秀AI排版如何生成H5页面_易企秀AI排版H5制作入口与组件添加【方法】  tofai官网正版入口 tofai网页版免费使用  打破传统,拥抱幸福:公主如何找到真我? 

 2023-11-18

了解您产品搜索量及市场趋势,制定营销计划

同行竞争及网站分析保障您的广告效果

点击免费数据支持

提交您的需求,1小时内享受我们的专业解答。

南京市珐之弘网络技术有限公司


南京市珐之弘网络技术有限公司

南京市珐之弘网络技术有限公司专注海外推广十年,是谷歌推广.Facebook广告全球合作伙伴,我们精英化的技术团队为企业提供谷歌海外推广+外贸网站建设+网站维护运营+Google SEO优化+社交营销为您提供一站式海外营销服务。

 87067657

 13565296790

 87067657@qq.com

Notice

We and selected third parties use cookies or similar technologies for technical purposes and, with your consent, for other purposes as specified in the cookie policy.
You can consent to the use of such technologies by closing this notice, by interacting with any link or button outside of this notice or by continuing to browse otherwise.