随着大模型技术的发展与落地,「模型治理」已经成为了目前受到重点关注的命题。只不过,在实践中,研究者往往感受到多重挑战。
一方面,为了高其在目标任务的性能表现,研究者会收集和构建目标任务数据集并对大语言模型(LLM)进行微调,但这种方式通常会导致除目标任务以外的一般任务的性能明显下降,损害 LLM 原本具备的通用能力。
另一方面,开源社区的模型逐渐增多,大模型开发者也可能在多次训练中累计了越来越多的模型,每个模型都具有各自的优势,如何选择合适的模型执行任务或进一步微调反而成为一个问题。
近日,智源研究院信息检索与知识计算组发布 LM-Cocktail 模型治理策略,旨在为大模型开发者提供一个低成本持续提升模型性能的方式:通过少量样例计算融合权重,借助模型融合技术融合微调模型和原模型的优势,实现「模型资源」的高效利用。
☞☞☞AI 智能聊天, 问答助手, AI 智能搜索, 免费无限量使用 DeepSeek R1 模型☜☜☜
模型融合技术可以通过融合多个模型提高单模型的性能。受此启发,LM-Cocktail 策略进一步通过对目标任务计算不同模型的重要性,赋予不同模型不同的权重,在此基础上进行模型融合,在提升目标任务上性能的同时,保持在通用任务上的强大能力。
LM-Cocktail 策略的作用类似于制作鸡尾酒,它可以将各个模型的优势能力汇总起来,通过调配不同的模型,创造出一个拥有多种特长的「多才」模型
具体而言,LM-Cocktail 可以通过手动选择模型配比,或者输入少量样例自动计算加权权重,来融合现有模型生成一个新模型,该过程不需要对模型进行重新训练并且具备适配多种结构的模型,如大语言模型 Llama,语义向量模型 BGE 等。
如果开发者缺乏某些目标任务的标签数据,或者缺少计算资源进行模型微调,那么可以采用LM-Cocktail策略来省去模型微调的步骤。只需构造极少量的数据样例,就可以融合开源社区中已有的大型语言模型,以调制自己的「LM鸡尾酒」
如上图所示,在特定目标任务上微调 Llama,可以显著提高目标任务上的准确度,但损害了在其他任务上的通用能力。采用 LM-Cocktail 可以解决这个问题。
LM-Cocktail 的核心是将微调后的模型与多个其他模型的参数进行融合,整合多个模型的优点,在提高目标任务上准确度的同时,保持在其他任务上的通用能力。具体形式为,给定目标任务、基础模型,以及一个在该任务上微调基础模型后得到的模型,同时收集开源社区或以往训练过的模型组成集合。通过目标任务上少量的样例计算每个模型的融合加权权重,对这些模型的参数进行加权求和,得到新的模型(具体的过程请参考论文或开源代码)。如果开源社区不存在其他模型,也可以直接融合基础模型和微调模型,在不降低通用能力的基础上提升下游任务表现。
用户在实际应用场景中,由于数据和资源的限制,可能无法进行下游任务的微调,即没有在目标任务微调过后的模型。这种情况下,用户可以通过构造非常少量的数据样例融合社区中已有的大语言模型,生成一个面向新任务的模型,提高目标任务的准确度,而无需对模型进行训练。
1. 弹性微调以保持通用能力
从上图中可以看到,在某个目标任务上进行微调之后,微调后的模型大幅提高了在该任务上的准确度,但其他通用任务上的准确度都有所下降。例如,在 AG News 到训练集上进行微调,Llama 在 AG News 测试集上准确度从 40.80% 涨到 94.42%,但在其他任务上准确度从 46.80% 下降到了 38.58%。
然而,通过简单的融合微调后模型和原模型的参数,在目标任务上实现了具有竞争力的性能 94.46%,与微调模型相当,同时在其他任务上准确度为 47.73%, 甚至稍强于原模型的性能。在某些任务下,如 Helleswag, 融合后的模型甚至可以在该微调任务上超过微调后的模型,并在其他任务上超过原通用模型,即在继承微调模型和原模型的优点的同时,超过了他们。可以看出,通过 LM-Cocktail 计算融合比例,进一步融合其他微调模型,可以在保证目标任务准确度的同时,进一步提升在其他任务上的通用性能。
2. 混合已有模型处理新任务
重写后的内容:图表展示了语言模型目标任务MMLU
重写后的内容:图片:向量模型的目标任务是检索(信息检索)
微调模型需要大量的数据,同时需要大量的计算资源,尤其是微调大语言模型,这些在实际情况中不一定可以实现。在无法对目标任务进行微调的情况下,LM- Cocktail 可以通过混合已有的模型(来自开源社区或者自己历史训练积累)来实现新的能力。
通过只给定 5 条样例数据,LM-Cocktail 自动计算融合加权权重,从已有的模型进行筛选然后融合得到新的模型,而无需使用大量数据进行训练。实验发现,生成的新模型可以在新的任务上得到更高的准确度。例如,对于 Llama,通过 LM- Cocktail 融合现有 10 个模型(其训练任务都与 MMLU 榜单无关),可以取得明显的提升,并且要高于使用 5 条样例数据进行上下文学习的 Llama 模型。
请尝试使用 lm-cocktail,我们欢迎您通过github issue提供反馈和建议:https://github.com/flagopen/flagembedding/tree/master/lm_cocktail
# 继承
# github
# https
# issue
# llama
# 开源
# 样例
# 可以通过
# 多个
# 重写
# 到新
# 自己的
# 新任务
# 情况下
# 信息检索
相关栏目:
【
Google疑问12 】
【
Facebook疑问10 】
【
网络优化91478 】
【
技术知识72672 】
【
云计算0 】
【
GEO优化84317 】
【
优选文章0 】
【
营销推广36048 】
【
网络运营41350 】
【
案例网站102563 】
【
AI智能45237 】
相关推荐:
ChatGPT 如何助力建筑承包商?三大实用技巧解析
AI 3D建模革命:免费生成高质量模型和纹理
Motion 教程:AI 驱动的智能日程安排,提高工作效率
夸克AI怎么用AI写作_夸克AI写作功能与模板选择【指南】
如何配置 DeepSeek 以支持企业级私有化部署
Kaiber AI视频制作教程:轻松打造吸睛AI视频
Sora 2 API 全面解析:功能、应用与 Lovable 集成指南
如何利用豆包 AI 快速查询当地生活服务资讯
2025年10月狮子座运势:事业、爱情与生活指南
LeetCode算法:最长公共前缀问题全面解析
教你用AI把照片变成动漫风格,3个简单步骤刷爆朋友圈
智行ai抢票怎样设置抢票通道_智行ai抢票通道选择与速度优化【指南】
Z170芯片组内存兼容性问题终极指南
雷小兔ai智能写作如何生成文案_雷小兔ai智能写作文案生成场景选择【攻略】
AI视频创作终极指南:文本到视频的免费工具与技巧
使用ChatGPT快速生成专辑封面:AI艺术创作指南
雷小兔ai智能写作如何生成日记_雷小兔ai智能写作日记模板调用【步骤】
利用 DeepSeek 进行大规模 C++ 代码库审计
千问怎么使用插件功能_千问插件调用与功能扩展【教程】
使用AI配乐:ElevenLabs Music音乐生成器终极指南
教你用AI将一段旋律扩展成一首完整的曲子
动漫肌肉美学:盘点最佳动漫肌肉男体格
AI数字人教程:轻松打造专属YouTube虚拟形象
AI QA 工程:通往人工智能质量保障工程师的职业道路
DeepSeek金融数据分析教程 DeepSeek量化交易策略开发
去哪旅行ai抢票助手怎样提升抢票速度_去哪旅行ai抢票助手加速包与多通道使用【技巧】
AI简历生成器:提升求职效率的智能工具
Codova AI:终极动态QR码生成器教程与功能详解
Artist.ly AI Image Designer: 终极指南
Claude怎样写任务型提示词_Claude任务提示词写法【步骤】
Tradie Hub:领先的线索管理系统,助力业务增长
如何通过 DeepSeek 优化分布式存储系统架构
生物医学图像分割:U-Net模型训练与应用详解
AI辅助儿童圣经课程创作:轻松制作教育视频
Filmora 13 AI音乐生成器:创意视频配乐新纪元
标准渣打银行电子账单下载完全指南:轻松管理财务
VHEER AI:免费在线AI图像生成器终极指南
探索古希腊之美:AI打造的绝|美女|神形象赏析
EdrawMind终极评测:AI赋能思维导图,提升效率与创造力
百度浏览器ai对话怎么关 百度浏览器ai聊天窗口隐藏
谷歌 Nano Banana:免费AI图像生成的强大工具
Venggage AI Pitch Deck生成器:快速创建投资者演示文稿
利用AI自动化回复Google Voice短信:终极指南
lovemo官网网页版入口 lovemo官网登录入口
Talvix AI:AI驱动的招聘平台,提升招聘效率和质量
怎么用ai制作表情包 AI个性化动态表情包教程【方法】
DiagramMagic:AI驱动的在线图表生成器终极指南
E-LabVine:AI赋能的数字化学习平台,提升高中学业表现
Apollo.io vs Instantly AI:深度测评与功能对比
稿定设计AI抠图怎么修复瑕疵_稿定设计AI瑕疵修复与手动微调【步骤】
2023-12-14
南京市珐之弘网络技术有限公司专注海外推广十年,是谷歌推广.Facebook广告全球合作伙伴,我们精英化的技术团队为企业提供谷歌海外推广+外贸网站建设+网站维护运营+Google SEO优化+社交营销为您提供一站式海外营销服务。