LinkedIn在利用大型语言模型服务十亿用户中的收获


☞☞☞AI 智能聊天, 问答助手, AI 智能搜索, 免费无限量使用 DeepSeek R1 模型☜☜☜

在全球拥有超过10亿用户的linkedin,不断挑战当今企业技术的极限。很少有公司能够太像linkedin那样运营,或者拥有类似的大量数据资源。

这个专注于商业和就业的社交媒体平台将合格的候选人与潜在雇主联系起来,帮助填补职位空缺是其核心业务。同样重要的是确保平台上的帖子反映了雇主和消费者的需求。在LinkedIn的模式下,这些匹配过程一直依赖于技术。

到了2025年夏天,当GenAI第一次高涨时,LinkedIn开始考虑是否利用大型语言模型(LLMs)来匹配候选人与雇主,并使信息流更加有用。

因此,这家社交媒体巨头开启了一段GenAI的旅程,并现在正在报告其利用Microsoft的Azure OpenAI服务的经验结果。各行各业的CIOs都可以从LinkedIn中在此过程中学到的一些经验。

起伏跌宕

正如大多数CIO所经历的那样,采用新兴技术伴随着试验和挫折。LinkedIn的情况也不例外,据该公司的首席软件工程师和技术负责人Juan Bottaro所说,其走向LLM协同的道路一点也不平坦。

Bottaro表示,最初的成果“感觉不够完善”,“连接的点还不够多。”

围绕GenAI的首波炒作并没有帮助。

“LLM是新事物,感觉它能解决所有问题,”Bottaro说。“我们开始时对LLM能做什么并没有一个非常清晰的概念。”

例如,早期版本的改进型职位匹配工作可以说是相当的,用一个不太恰当的词来说,粗鲁。或者至少过于直白。

“点击‘评估我是否适合这份工作’后得到‘你完全不适合’并不实用,”Bottaro说。“我们希望[回应]既事实准确,同时也要有同理心。有些会员可能正在考虑转行到他们目前并不十分适合的领域,需要帮助了解差距和下一步该怎么做。”

因此,LinkedIn初步学到的一个重要经验是调整LLM以满足观众的期望——并帮助LLM理解如何以一种或许不是人类,但至少是人性化的方式来回应。

速度问题

尽管LinkedIn拥有超过十亿会员,依靠LinkedIn的LLM工作的大部分求职功能最初是针对高级会员的,这是一个相对较小的群体。(LinkedIn拒绝透露其拥有多少高级会员。)

在如此大的规模运作时,速度是至关重要的,特别是在与相关职位匹配候选人这样细致的事务上。这里,人们认为LLM会有所帮助,因为LLM的一个经常被提及的优点是其速度,使它们能够迅速完成复杂的步骤。但Bottaro表示,LinkedIn的部署并非如此。

“我不会说LLM很快。我不认为速度是一个优势,”他说。

速度可以有多种定义。虽然在操作上LLM可能没有像希望的那样快,但Bottaro表示整体部署过程的加速令人震惊。“这项新技术的超能力在于你可以非常快速地创建原型,大约在两到三个月之间。在这项技术出现之前,这是不可能的,”他说。

当被问及如果没有LLM,项目的各个方面需要多久时,Bottaro表示有些可能根本无法完成,而其他元素“可能需要几年时间。”

作为一个例子,Bottaro提到了旨在理解意图的系统部分。没有LLM,这可能需要两到三个月,但LLM在“不到一周”的时间内就掌握了它。

成本考虑

Bottaro称之为“障碍”的一个方面是成本。同样,成本在项目的不同阶段意味着不同的东西,正如LinkedIn的经验所示。

“我们用于开发的金额微不足道,”Bottaro说。但当涉及到向LinkedIn的客户提供数据时,成本激增。

“即便只是针对几百万会员,”Bottaro说,这可能暗示了高级会员的数量,价格也飙升了。这是因为LLM的定价——至少是LinkedIn与Microsoft(其LLM提供商及母公司)达成的许可协议——是基于使用量的,具体来说是输入和输出令牌的使用量。

一位AI供应商的首席执行官Tarun Thummala在一篇与此项目无关的LinkedIn帖子中解释说,LLM的输入和输出令牌大约相当于0.75个单词。LLM供应商通常按成千上万或成百万卖令牌。例如,LinkedIn使用的Azure OpenAI在美国东部地区收费标准为每100万个8K GPT-4输入令牌30美元,每100万个8K GPT-4输出令牌60美元。

评估挑战

LinkedIn为其项目设定的另一个功能目标是自动评估。LLM在准确性、相关性、安全性和其他关注点方面的评估一直是个挑战。领先的组织和LLM制造商一直在尝试自动化一些工作,但据LinkedIn称,这种能力“仍然是在进行中”。

没有自动化评估,LinkedIn报告称“工程师们只能靠目测结果,并在有限的样本集上进行测试,且通常会有超过1天的延迟才能知道指标。”

该公司正在构建基于模型的评估器,以帮助估计关键的LLM指标,如整体质量得分、幻觉率、连贯性和负责任的AI违规情况。这样做将能够加快实验的速度,公司的工程师说,尽管LinkedIn的工程师在幻觉检测方面取得了一些成功,但他们还没有完成该领域的工作。

数据质量

LinkedIn在其职位匹配努力中遇到的部分挑战归结为双方的数据质量问题:雇主和潜在雇员。

LLM只能使用提供给它的数据,有时候职位发布并不精确或全面地说明雇主所寻求的技能。另一方面,一些求职者发布的简历表述不佳,无法有效反映他们在解决问题等方面的丰富经验。

在这方面,Bottaro看到了LLM帮助雇主和潜在雇员的潜力。通过改善雇主和LinkedIn用户的书写,双方都能受益,因为公司的职位匹配LLM在数据输入质量更高时能够更有效地工作。

用户体验

在处理如此庞大的会员基础时,准确性和相关性指标可能“给人一种虚假的安慰感,”Bottaro说。例如,如果LLM“90%的时间都做得对,这意味着十分之一的人会有糟糕的体验,”他说。

使这种部署更加困难的是,提供有用、有帮助且准确答案所涉及的极端细微差别和判断。

“你如何定义什么是好的,什么是坏的?我们花了很多时间与语言学家一起制定关于如何提供全面代表性的指导。我们也做了很多用户研究,”Bottaro说。“你如何训练人们撰写正确的回应?你如何定义任务,规定回应应该是什么样的?产品可能试图建设性或有帮助。它不试图假设太多,因为那是幻觉开始的地方。我们对回应的一致性感到非常自豪。”

实时运营

LinkedIn庞大的规模为职位匹配带来了另一个挑战。在拥有十亿会员的情况下,一个职位广告在发布几分钟内可能会收到数百甚至数千个应聘回应。如果看到已经有数百人申请,许多求职者可能就不会再费心申请了。这就要求LLM非常迅速地找到匹配的会员,在资质较低的申请者提交材料之前做出反应。之后,会员是否看到通知并及时做出反应仍然是一个问题。

在雇主方面,挑战在于找到最合适的应聘者——不一定是反应最快的人。一些公司不愿公布薪资范围,这进一步复杂化了双方的努力,因为最合格的应聘者可能对职位的薪酬不感兴趣。这是一个LLM无法解决的问题。

API和RAG

LinkedIn庞大的数据库包含了关于个人、雇主、技能和课程的许多独特信息,但其LLM尚未接受过这些数据的培训。因此,根据LinkedIn工程师的说法,它们目前无法使用这些资产进行任何推理或生成响应的活动,因为这些资产是如何存储和提供的。

在这里,检索增强生成(RAG)是一个典型的解决方案。通过建立内部API的管道,企业可以用额外的上下文“增强”LLM提示,以更好地指导和限制LLM的响应。LinkedIn的大部分数据通过RPC API公开,公司的工程师说这“方便人类以编程方式调用”,但“对LLM并不友好”。

为了解决这个问题,LinkedIn的工程师围绕其API“封装了技能”,给它们提供了一个“对LLM友好的API功能描述以及何时使用它”,以及配置细节、输入和输出架构以及将每个API的LLM版本映射到其底层(实际)RPC版本所需的所有逻辑。

LinkedIn的工程师在一份声明中写道:“像这样的技能使LLM能够执行与我们产品相关的各种操作,如查看个人资料、搜索文章/人员/职位/公司,甚至查询内部分析系统。”他们还提到,“同样的技术也用于调用非LinkedIn的API,如Bing搜索和新闻。”这种方法不仅提高了LLM的功能性,还增强了其与现有技术基础设施的整合能力,使得LLM能够更广泛地应用于企业的各个方面。


# 令牌  # 人与  # 这是一个  # 该公司  # 我不  # 会有  # 是一个  # 的是  # 的人  # 他说  # 人工智能  # gpt  # 自动化  # 软件工程  # azure  # microsoft  # rpc  # 数据库  # 封装  # 架构 


相关栏目: 【 Google疑问12 】 【 Facebook疑问10 】 【 网络优化91478 】 【 技术知识72672 】 【 云计算0 】 【 GEO优化84317 】 【 优选文章0 】 【 营销推广36048 】 【 网络运营41350 】 【 案例网站102563 】 【 AI智能45237


相关推荐: 怎么用ai写产品说明书 AI功能介绍与使用步骤详解【实操】  探索未来:AI机器人AURORA揭秘亚特兰蒂斯之谜  AI音乐创作:颠覆传统,开启音乐新纪元  Excel AI:5大免费AI功能提升数据分析效率  使用 ChatGPT 自动生成月度财务分析报告  Filmora AI 语音增强和降噪终极指南  找不到百度AI助手入口 最新官网登录入口  豆包AI的发现页面有什么功能_探索热门智能体与话题  ChatGPT新手指南:大学生如何高效利用AI工具?  TopMedi AI:AI语音克隆和文本转语音终极指南  银行经理写给银行经理的信:实用模板和关键要素  AI在软件测试中的应用:提升效率与质量的关键策略  如何用AI帮你把小说改编成电影剧本?3步掌握核心技巧  雷小兔ai智能写作怎样导入素材_雷小兔ai智能写作素材上传与引用【技巧】  利用MECLABS AI解决业务难题:实用指南  PixianAI抠图怎么修复瑕疵_PixianAI瑕疵修复与手动涂抹工具【步骤】  Feelin网页版在线玩 Feelin角色扮演网页版入口  AI产品经理:AI赋能与AI原生,未来PM的技能演进  百度ai助手怎么设置不显示 百度ai助手界面净化设置  Descript音频编辑终极指南:技巧、AI工具与专业效果  Gemini怎样用快捷指令_Gemini快捷指令使用教程【步骤】  ChatGPT 处理非结构化数据并转换为 JSON 格式  唐库AI拆书工具怎么查看拆书进度_唐库AI拆书工具进度查看与异常排查【方法】  kimi生成ppt怎么编辑文字_kimi编辑文字后怎么保存  AI海报设计终极指南:用ChatGPT和ImageFX轻松创建专业级海报  通义万相做小红书配图怎么用_通义万相做小红书配图使用方法详细指南【教程】  清洁扫地机器人传感器:解决导航和充电难题  Claude官网在线对话地址 Claude官方网站直接使用  股票 vs. ETF:解锁股市财富密码,新手投资完全指南  豆包Ai在线使用入口_豆包Ai官方网站最新登录地址  YouTube SEO优化:AI驱动的标题生成工具详解  ClaudePC端怎么设主题色_ClaudePC端主题设置步骤【教程】  AI聊天机器人会取代人类吗?深度剖析与未来展望  Midjourney怎么用一键生成海报_Midjourney海报生成教程【方法】  tofai网页版官方入口 tofai官网登录网址  Sim.AI教程:构建智能客户支持助手  AI驱动的医学影像器官分割与3D可视化:临床应用的未来  lovemo手机网页版入口 lovemo官网登录网址  解密Poppy Playtime怪物:全面解析玩具世界背后的故事  SEO必备工具:网站分析与优化终极指南  Venggage AI Pitch Deck生成器:快速创建投资者演示文稿  解锁 Gemini Gems 高级用法:打造专属 AI 专家助手  DeepSeek金融数据分析教程 DeepSeek量化交易策略开发  如何通过文心一言进行地道的文言文翻译  Character AI深度解析:功能、用户反馈与替代方案全攻略  Weavernote:AI驱动的知识管理与高效笔记应用  AI赋能副业:五大掘金机会,轻松开启智能创收时代  百度浏览器侧边栏ai怎么关 百度浏览器ai侧边栏隐藏  Vizeo AI视频生成器:无需技术,轻松打造营销利器  AI赋能招聘:高级策略助你领先猎头行业 

 2024-04-26

了解您产品搜索量及市场趋势,制定营销计划

同行竞争及网站分析保障您的广告效果

点击免费数据支持

提交您的需求,1小时内享受我们的专业解答。

南京市珐之弘网络技术有限公司


南京市珐之弘网络技术有限公司

南京市珐之弘网络技术有限公司专注海外推广十年,是谷歌推广.Facebook广告全球合作伙伴,我们精英化的技术团队为企业提供谷歌海外推广+外贸网站建设+网站维护运营+Google SEO优化+社交营销为您提供一站式海外营销服务。

 87067657

 13565296790

 87067657@qq.com

Notice

We and selected third parties use cookies or similar technologies for technical purposes and, with your consent, for other purposes as specified in the cookie policy.
You can consent to the use of such technologies by closing this notice, by interacting with any link or button outside of this notice or by continuing to browse otherwise.