折腾ChatGLM的几个避坑小技巧


我昨天说从数据技术嘉年华回来后就部署了一套ChatGLM,准备研究利用大语言模型训练数据库运维知识库,很多朋友不大相信,说老白你都这把年纪了,还能自己去折腾这些东西?为了打消这些朋友的疑虑,我今天把这两天折腾ChatGLM的过程分享给大家,也为有兴趣折腾一下ChatGLM的朋友讲一下避坑的一些技巧。

ChatGLM-6B是基于清华大学 KEG 实验室与智谱 AI 于2025年联合训练的语言模型 GLM 开发而成,是一个大型的语言模型,其针对用户的问题和要求提供适当的答复和支持。上面的回答是ChatGLM自己回答的,GLM-6B是一个开源的62亿参数的预训练模型,其特点是可以在比较小的硬件环境下本地运行。这一特性可以让基于大语言模型的应用可以走进千家万户。KEG实验室的目的是要让更大的GLM-130B模型(1300亿参数,与GPT-3.5相当)能够在一个8路RTX 3090的低端环境中完成训练。

☞☞☞AI 智能聊天, 问答助手, AI 智能搜索, 免费无限量使用 DeepSeek R1 模型☜☜☜

如果这个目标真的能实现,那么对想基于大语言模型做一些应用的人来说绝对是一个福音。目前的ChatGLP-6B的FP16模型大约13G多一点,INT-4量化模型不到4GB,完全可以在一块6GB显存的RTX 3060TI上运行。

在部署前我不太了解这些情况,因此买了一块不上不下的12GB的RTX 3060,于是完成安装部署后仍然无法运行FP16的模型。早知道在自己家里做测试验证,直接买块价格更便宜的3060TI就可以了。而如果要运行无损的FP16模型,就必须上24GB显存的3090了。

如果你仅仅是想在自己的机器上测试一下ChatGLP-6B的能力,那么你可能不需要直接去下载THUDM/ChatGLM-6B模型,在huggingface上有一些打包好的量化模型可以下载。模型下载速度很慢,你可以直接下载int4的量化模型。

我这次安装是在一台I7 8核的PC机上完成的,显卡为12G显存的RTX 3060,因为这台电脑是我的工作电脑,因此我把ChatGLM安装在了WSL子系统上。在WINDOWS WSL 子系统上安装ChatGLM比直接在LINUX环境中安装要复杂一些。其中最大的坑是显卡驱动的安装。直接在Linux上部署ChatGLM的时候,需要直接安装NVIDIA的驱动程序,通过modprobe来激活网卡驱动就可以了。而在WSL上安装则大有不同。

ChatGLM可以在github上下载,在网站上也有一些简单的文档,甚至包含一个在WINDOWS WSL上部署ChatGLM的文档。只不过如果你是这方面的小白,完全按照这个文档去部署,会遇到无数的坑。

Requriements.txt文档里列出了ChatGLM使用的主要开源组件的清单与版本号,其核心是transformers,需要版本4.27.1,实际上要求没有这么严格,略低一点也没太大问题,不过安全起见还是用相同的版本为好。Icetk是做Token处理的,cpm_kernels是中文处理模型与cuda的核心调用,protobuf是结构化数据存储的。Gradio是用于利用Python快速生成AI应用的框架。Torch就不用我多做介绍了。

ChatGLM可以在没有GPU的环境中使用,利用CPU和32GB的物理内存来运行,不过运行速度很慢,仅仅能够用来做个演示验证而已。要想玩ChatGLM最好还是配备一块GPU。

在WSL上安装ChatGLM最大的坑是显卡驱动,在Git上ChatGLM的文档十分不友好,对于不太了解这个项目或者没有做过此类部署的人来说,文档实在太坑。实际上软件部署并不麻烦,而显卡驱动就十分有技巧性。

因为是在WSL subsystem上部署,因此LINUX只是一个*系统,并不是完整的LINUX,因此英伟达的显卡驱动只需要在WINDOWS上安装,不需要在WSL里激活。不过在WSL的LINUX虚拟环境中还是需要安装CUDA TOOLS。WINDOWS上的英伟达驱动一定要安装官网上的最新驱动,而不能使用WIN10/11自带的兼容性驱动,因此从官网上下载最新驱动并安装一定不要省略。

安装完WIN的驱动后就可以直接在WSL里安装cuda tools了,安装完毕后,运行nvidia-smi如果能够看到上面的界面,那么恭喜你,你已经成功地避开了第一个坑。实际上在安装cuda tools时候还会遇到几个小坑。那就是你的系统中必须安装合适版本的gcc,gcc-dev和make等编译相关的工具,如果缺少这些组件,cuda tools的安装会失败。

上面就是坑人的前期准备,实际上避开英伟达驱动这个坑,后面的安装还是很顺利的。在系统的选择上,我还是建议选择Debian兼容的Ubuntu,新版的Ubuntu的aptitude十分智能,能够帮你解决大量软件的版本兼容问题,实现部分软件的自动降版本。

下面的安装过程完全按照安装指南就可以顺利完成了,要注意的是替换/etc/apt/sources.list里面的安装源的工作最好按照指南完成,一方面安装速度会快很多,另外一方面也避免出现软件版本兼容性的问题。当然不替换也不一定会影响后面的安装过程。

如果你顺利地通过了前面的各道关卡,那么你就进入到了最后一步,启动web_demo了。执行python3 web_demo.py可以启动一个WEB对话的例子。这时候如果你是个穷人,只有一张12GB显存的3060,那么你就一定会看到上面的报错了,哪怕你把PYTORCH_CUDA_ALLOC_CONF设置为最小的21,也无法避开这个报错。这时候你就不能偷懒了,必须简单地改写一下python脚本。

默认的web_demo.py是使用FP16的预训练模型的,13GB多的模型肯定无法装载到12GB现存里的,因此你需要对这个代码做一个小的调整。

你可以改为quantize(4)来装载INT4量化模型,或者改为quantize(8)来装载INT8量化模型。这样你的显卡内存就够用了,而且可以支持你做各种对话了。

要注意的是,web_demo.py启动后,模型的下载工作才真正开始,因此要下载13GB的模型,需要相当长的时间,你可以把这项工作放到半夜做,或者你直接用迅雷等下载工具预先从hugging face上下载模型。如果你对模型一无所知,不太会安装下载的模型,你也可以修改代码中的模型名称,THUDM/chatglm-6b-int4,直接从网上下载只有不到4GB的INT4量化模型,这样会快很多,反正你的破显卡也跑不起FP16的模型。

至此,你可以通过网页与ChatGLM对话了,不过这一切只是折腾的开始。只有你能够把你的微调模型训练出来了,那么你的ChatGLM的入坑之旅才会真正开始。玩这种东西还是需要大量的精力和金钱的,入坑要慎重。

最后我还是十分感谢清华大学KEG实验室的朋友,他们的工作让更多的人可以低成本地使用大语言模型。


# debian  # 如果你  # 的是  # 的人  # 显卡驱动  # 就可以  # 你就  # 显存  # 文档  # 是一个  # 你可以  # gpt  # Python  # ubuntu  # linux  # gpt-3.5  # gpt-3  # 数据库  # windows  # git  # github  # int  # Token 


相关栏目: 【 Google疑问12 】 【 Facebook疑问10 】 【 网络优化91478 】 【 技术知识72672 】 【 云计算0 】 【 GEO优化84317 】 【 优选文章0 】 【 营销推广36048 】 【 网络运营41350 】 【 案例网站102563 】 【 AI智能45237


相关推荐: AI时代生存指南:掌握软实力,成为不可替代的人  Motion 教程:AI 驱动的智能日程安排,提高工作效率  探索泰勒·斯威夫特《August》的深层含义:歌词解析与情感分析  千问如何生成预算执行总结_千问预算数据与执行对比分析【方法】  百度浏览器侧边栏ai怎么关 百度浏览器ai侧边栏隐藏  使用AI配乐:ElevenLabs Music音乐生成器终极指南  tofai入口官方网站 tofai网页版入口地址  唐库AI拆书工具如何批量导出笔记_唐库AI拆书工具批量导出与格式转换【方法】  Wrike:AI赋能的项目管理平台,提升电商效率与团队协作  雷小兔ai智能写作如何生成日记_雷小兔ai智能写作日记模板调用【步骤】  文本分类与聚类:网络安全中的自然语言处理应用  看我如何用AI辅助写作,在10分钟内搞0. AI求职信写作避坑指南:千万别犯这几个错误  EdrawMind终极评测:AI赋能思维导图,提升效率与创造力  AI图像生成偏见:克服与优化,打造更真实的数字形象  百度AI助手聊天入口 文心一言对话窗口入口  AI在软件测试中的应用:提升效率与质量的关键策略  Mootion AI视频生成器:一键创作动画故事!  如何通过豆包 AI 进行每日新闻简报的个性化定制  AI怎么修复模糊视频 视频画质增强AI软件Topaz Video使用【教程】  Midjourney怎么用一键生成海报_Midjourney海报生成教程【方法】  普通人如何用DeepSeek月入过万?2026最新赚钱路径全解析!  OpenAI DevDay 2025:开发者必知的七大AI进展  怎么用AI帮你写一份客户感谢信?维系客户关系的利器  使用AI简化多机位播客视频编辑:Eddie AI全面指南  Bluecap:加拿大AI会议助手,提升混合办公效率  OpenArt:终极AI内容创作平台,图像、视频和角色一致性  百度ai助手悬浮球怎么关 百度ai助手悬浮窗去除方法  AI vs. 人工书籍教练:哪个更适合你?终极指南  利用 DeepSeek 进行大规模 C++ 代码库审计  AI加持:2025年最佳人工智能潜在客户生成工具  ChatGPT 提示词工程:结构化指令编写指南  飞猪旅行AI如何预约抢票_飞猪AI抢票预约与加速包使用【攻略】  利用 Google AI 进行图像元数据分析与整理  Depseek能否生成领导汇报版总结_Depseek汇报版结构调整与精简技巧【教程】  AI Lead Generation: 解锁未来增长引擎,营销新纪元  AI邮件营销风险解析:如何规避客户触达的潜在陷阱  DeepSeek网页版怎么用_DeepSeek网页版使用方法详细指南【教程】  千问如何切换回答风格_千问风格选择正式口语等【实操】  Semrush AI标题生成器:免费提升SEO和内容创作效率  tofai官网正版入口 tofai网页版免费使用  智行ai抢票如何查看抢票进度_智行ai抢票进度查询与状态解读【实操】  歌曲分析:The Killers乐队的《Mr. Brightside》歌词深度解析  LeetCode算法:最长公共前缀问题全面解析  BEILA:用AI驱动的低代码开发平台详解  雷小兔ai智能写作如何优化语句_雷小兔ai智能写作语句润色技巧【攻略】  Guru知识管理平台:AI驱动的企业知识中心构建指南  Mermaid Playground: AI驱动的图表秒速创建指南  Gemini 辅助进行多平台社交媒体内容调度  AI驱动的自动化工作流:Zapier、Perplexity和Claude集成指南  百度输入法全感官ai怎么关 百度输入法全感官皮肤关闭 

 2023-05-02

了解您产品搜索量及市场趋势,制定营销计划

同行竞争及网站分析保障您的广告效果

点击免费数据支持

提交您的需求,1小时内享受我们的专业解答。

南京市珐之弘网络技术有限公司


南京市珐之弘网络技术有限公司

南京市珐之弘网络技术有限公司专注海外推广十年,是谷歌推广.Facebook广告全球合作伙伴,我们精英化的技术团队为企业提供谷歌海外推广+外贸网站建设+网站维护运营+Google SEO优化+社交营销为您提供一站式海外营销服务。

 87067657

 13565296790

 87067657@qq.com

Notice

We and selected third parties use cookies or similar technologies for technical purposes and, with your consent, for other purposes as specified in the cookie policy.
You can consent to the use of such technologies by closing this notice, by interacting with any link or button outside of this notice or by continuing to browse otherwise.