「社交达人」GPT-4!解读表情、揣测心理全都会


想象一下,您正在参加一个充满活力的鸡尾酒会,局间充满了热烈的谈话声和玻璃杯碰撞的叮当声。

此时,您作为一个悠闲的观察者,怡然自得地躲在角落里。然而,就算没有处在聚会的中心,您还是可以轻松地弄清楚不同人之间的社会关系,了解正在发生的事情,甚至通过阅读人们的言语和非言语线索来读懂明里暗里的社交信息。

如果一个LLM能够复现这种水平的社交能力呢?这不,Koko Mind就是这么个东西。

☞☞☞AI 智能聊天, 问答助手, AI 智能搜索, 免费无限量使用 DeepSeek R1 模型☜☜☜

随便打开一个视频,该模型就开始分析人物表情,得出人物情绪的结论。

然后,在右侧的prompt栏还可以提出问题,让AI进一步分析视频中暗流涌动的社交谜题。

(说实话对有些人来说这都很难)

图片

Koko Mind包含了150个复杂的多方社交互动以及自由文本问题和答案。

为了确保数据的多样性和可扩展性,并避免数据污染,所有社交互动、问题和答案均由GPT-4生成,并随后由人类专家验证。

分析数据基于三个不同的来源:

  • GPT-4-only:该子集仅由 GPT-4 通过提示创建。
  • 基于电影:为了避免数据污染,这部分数据基于从2025年之后上映的电影中提取的各种场景。GPT-4负责塑造这些场景,在保留核心本质的同时添加了自己的元素。
  • 基于 ToMi:该部分包含由模拟数据集ToMi支持的数据,其中涉及将物理对象移动到不同的地方,这是心理理论的经典测试。当然,这些社交互动还得被GPT-4修饰和扩展一下。

三种数据来源的占比如下:

图片

对于每次社交互动,研究人员都会提出各种问题,旨在探讨以下几个和社交理解息息相关的方面。

  • 心理理论:评估对其他人心理状态和观点的理解的问题。
  • 社会规范:旨在辨别情境中的社会价值观和规范的问题。
  • 情绪识别:旨在识别和理解上下文中的情绪元素的问题。
  • 社会关系:关注人际动态和关系。
  • 反事实问题:旨在探索替代结果或可能性的假设查询。
  • 社会建议:提出与特定情况相关的建议或行动建议的问题。

研究人员以text-davinci-003 作为参考,评估了AlpacaEval后的不同模型。

其中,研究人员从上下文中删除了括号中的非语言线索(例如,紧张地喝咖啡等)。

以下则是一些有趣的要点:

  • 在两个模型中,与Claude相比,GPT-4在识别获胜模型方面表现出更大的确定性和信心。
  • 当上下文没有非语言线索,且交互要么完全由GPT-4生成,要么基于电影时,Claude的表现优于 GPT-4。
  • 而如果上下文包含了非语言线索,那GPT-4总是比Claude更好。

(一种可能的解释是,GPT-4是一种多模态模型可以更好地理解额外的非语言信息。)

在博客中,研究人员绘制了表格,可以清晰的看到各个模型的表现。

图片

结果虽然在很多方面都令人兴奋,但也有一定的局限性。首先, Koko Mind的规模相对较小,这可能会限制研究人员结论的广泛适用性和全面性。

其次, Koko Mind中的所有交互都是由GPT-4生成的,需要人工验证,这使得数据集难以扩展。

另外,虽然Koko Mind在数据集中提供了经过人工验证的答案,研究人员在评估时没有使用这些答案作为参考,并且由于这些答案是由GPT-4生成的,因此它们可能会偏向GPT-4。

未来的研究可以集中在如何评估模型上具有经过人工验证的机器生成的参考答案。

当然,虽说存在这样或那样的限制,研究人员仍将Koko Mind视为未来与社会智能、多模态语言模型等相关的研究的跳板。


# gpt-4  # claude  # 对象  # gpt  # prompt  # 互动  # 是由  # 社会关系  # 自己的  # 这是  # 多模  # 几个  # 未来  # 是一种  # 包含了 


相关栏目: 【 Google疑问12 】 【 Facebook疑问10 】 【 网络优化91478 】 【 技术知识72672 】 【 云计算0 】 【 GEO优化84317 】 【 优选文章0 】 【 营销推广36048 】 【 网络运营41350 】 【 案例网站102563 】 【 AI智能45237


相关推荐: AI Vibe Coding: 快速打造落地页,低代码平台实战教程  Artspace.ai: AI驱动的创意设计平台,提升小企业营销效率  智谱清言分析数据怎么用_智谱清言分析数据使用方法详细指南【教程】  AI邮件营销风险解析:如何规避客户触达的潜在陷阱  Depseek如何让提示词包含上下文_Depseek上下文补充提示词写法【步骤】  AI写作鱼怎么一键生成朋友圈文案_AI写作鱼文案风格切换与字数设置【指南】  海外留学资金证明:无银行流水也能成功申请签证的秘诀  客户生命周期价值:终极商业增长策略  Claude怎么用新功能表格生成_Claude表格生成使用【攻略】  留学文书PS怎么写?教你用AI写出招生官眼前一亮的个人陈述  利用AI赋能教育:学习方式的未来之路  Depseek能否批量生成部门总结_Depseek多部门总结批量生成步骤【方法】  找不到百度AI助手入口 最新官网登录入口  AI赋能副业:五大掘金机会,轻松开启智能创收时代  Canva AI工具教程:动漫化图像、生成艺术与定制QR码  即梦ai能否生成3D建模参考图_即梦ai3D参考图生成与视角设置【方法】  探索占星术:揭秘 कुंडली 中的 शुक्र,财富与运势的钥匙  怎么用ai做证件照换底色 AI一键抠图与背景色替换【方法】  通义千问怎样优化提示词效果_通义千问提示词优化技巧【攻略】  ChatGPT写论文大纲教程 辅助学术构思与资料检索操作方法  文心一言 4.0 在公文写作规范中的实战技巧  2025年最佳免费AI艺术生成器:POD终极指南  3步教你用AI总结会议录音,再也不怕错过重点  扣子AI能否连接企业微信_扣子AI企业微信对接与接口配置【攻略】  GitHub Copilot终极指南:提升代码效率与质量  如何在 Google Sheets 中利用 Gemini 自动填充数据  Tamilnad Mercantile Bank TMB:如何在线下载账户报表  Codeforces Pair Programming Problem: C 解题思路  AI如何变革法律行政助理角色?未来发展趋势分析  豆包AI能否用提示词调整回答深度_豆包AI深度控制提示词技巧【方法】  Amazon Rekognition: 图像与视频分析的强大AI工具  智行ai抢票怎么设置抢票截止时间_智行ai抢票截止时间设置与确认【步骤】  AI人像摄影新纪元:Gemini AI助力照片编辑  AI驱动合同管理:Microsoft Power Platform实战指南  探索都市传说:追寻鳄鱼飞机怪物“Bombardino Crocodilo”  DeepSeek写简历怎么用_DeepSeek写简历使用方法详细指南【教程】  唐库AI拆书工具怎么查看拆书进度_唐库AI拆书工具进度查看与异常排查【方法】  Orkestra Obsolete: 用古董乐器重塑经典“Blue Monday”  AI无镜头相机Paragraphica:颠覆传统摄影的新方式  PlotDot Horizon:AI编剧工具颠覆好莱坞?深度评测  AI Excel公式生成工具有哪些_一键生成函数公式的AI工具推荐  稿定设计AI抠图怎样处理复杂边缘_稿定设计AI复杂边缘细化技巧【技巧】  Midjourney怎样生成网页_Midjourney生成网页教程【方法】  如何利用豆包 AI 快速查询当地生活服务资讯  生成式AI革新客户服务:提升效率与个性化体验  AI vs. 人工书籍教练:哪个更适合你?终极指南  Descript音频编辑终极指南:技巧、AI工具与专业效果  AI图像识别如何减少保险欺诈和加速理赔  重温经典:宝可梦动画中的精彩瞬间与幕后花絮  BEILA:用AI驱动的低代码开发平台详解 

 2023-07-22

了解您产品搜索量及市场趋势,制定营销计划

同行竞争及网站分析保障您的广告效果

点击免费数据支持

提交您的需求,1小时内享受我们的专业解答。

南京市珐之弘网络技术有限公司


南京市珐之弘网络技术有限公司

南京市珐之弘网络技术有限公司专注海外推广十年,是谷歌推广.Facebook广告全球合作伙伴,我们精英化的技术团队为企业提供谷歌海外推广+外贸网站建设+网站维护运营+Google SEO优化+社交营销为您提供一站式海外营销服务。

 87067657

 13565296790

 87067657@qq.com

Notice

We and selected third parties use cookies or similar technologies for technical purposes and, with your consent, for other purposes as specified in the cookie policy.
You can consent to the use of such technologies by closing this notice, by interacting with any link or button outside of this notice or by continuing to browse otherwise.