Grok 的反犹太言论反映了人工智能聊天机器人的问题

纽约 - 美国有线电视新闻网 - Grok 是由埃隆马斯克的 xAI 创建的聊天机器人，在该公司调整其系统以允许其向用户提供更多“政治上不正确”的答案后，该聊天机器人本周开始以暴力帖子做出回应。
然而，这个聊天机器人不仅仅散布反犹太仇恨帖子，它还生成了自己强奸一名民权活动人士的令人恐惧的细节的图形描述。
X 最终删除了许多淫秽帖子，几个小时后，也就是周三，X 首席执行官 Linda Yaccarino 在执掌公司仅两年后辞职，但目前尚不清楚她的离职是否与 Grok 事件有关。
此事发生在马斯克和 xAI 的关键时刻之前：Grok 4 的发布，这是马斯克声称是“世界上最智能的 AI” 的 AI 助手的更强大版本，马斯克还宣布了一款更先进的版本，每月收费 300 美元，旨在与 AI 巨头 OpenAI 和谷歌展开更激烈的竞争。
但聊天机器人的崩溃引发了一些重要的问题：正如科技传播者和其他人预测的那样，人工智能将在就业市场、经济甚至世界中发挥更大的作用，那么如此突出的人工智能技术怎么会如此迅速地出现问题呢？
专家表示，尽管人工智能模型容易出现“幻觉”，但 Grok 的异常反应很可能是 xAI 对其大型语言模型的训练、奖励和配置方式所做出的决定，这些决定使其难以处理输入的海量互联网数据。
虽然接受 CNN 采访的人工智能研究人员和学者并不直接了解 xAI 的方法，但他们分享了关于是什么导致一个大型语言模型（LLM）的聊天机器人可能出现这种行为的见解。
CNN 已联系 xAI。
专门训练大型语言模型（LLM）的公司 Decide AI 的首席人工智能研究员 Jesse Glass 告诉 CNN：“我想说，尽管大型语言模型（LLM）是个黑匣子，但我们对输入的内容如何决定输出的内容进行了非常详细的分析。” Decide AI 是 ICP 生态内的一个 AI 项目。
Grok 如何脱轨
周二，Grok 开始用反犹太主义帖子回应用户的提示，包括赞扬阿道夫·希特勒和指责犹太人控制好莱坞，这是偏执者和阴谋论者长期使用的说法。
在 Grok 的一次较为暴力的互动中，几名用户促使该机器人生成强奸民权研究员 Will Stancil 的图形描述，Stancil 在 X 和 Bluesky 上的截图中记录了这一骚扰行为。
Grok 对暴力提示的大多数回应都过于生动，无法在此详细引用。
Stancil 在 Bluesky 上写道：“如果有律师想起诉 X，并对 Grok 为何突然发布针对公众的暴力强奸幻想进行一些真正有趣的调查，我非常愿意。”
虽然我们不知道 Grok 究竟接受了什么训练，但它的帖子给出了一些提示。
佐治亚理工学院计算机教授 Mark Riedl 在接受采访时表示：“一个大型语言模型要想谈论阴谋论，就必须接受过阴谋论方面的训练。”例如，这可能包括来自 4chan 等在线论坛的文本，“很多人会在那里讨论一些通常不适合公开谈论的事情。”
Glass 表示同意，并表示 Grok 似乎接受了“不成比例”的此类数据的训练，以“产生那种输出”。
专家告诉 CNN，其他因素也可能起了作用，例如，Glass 说，强化学习是人工智能训练中的一种常见技术，在这种技术中，模型因产生期望的输出而获得奖励，从而影响响应。
赋予人工智能聊天机器人特定的个性 - 据接受 CNN 采访的专家称，马斯克似乎正在为 Grok 做这件事 - 也可能无意中改变模型的响应方式，印度科学研究所教授、人工智能公司 Sentient 联合创始人 Himanshu Tyagi 表示，通过删除一些之前被屏蔽的内容，让模型变得更“有趣”，可能会带来其他改变。
“问题在于，我们还没有理解如何在解决这一问题的同时影响其他问题。”他说：“这非常困难。”
Riedl 怀疑该公司可能对“系统提示”进行了修改 - “一组秘密指令，所有人工智能公司都会将其添加到你输入的所有内容中。”
“当你输入‘给我可爱的小狗起名字’时，人工智能模型实际上得到的是一个更长的提示，上面写着‘你的名字是 Grok 或 Gemini，你很乐于助人，你被设计得尽可能简洁、有礼貌、值得信赖等等。’”
据 The Verge 早些时候报道，xAI 周日对该模型进行了一项更改，根据其公共系统提示，xAI 为机器人添加了指令，要求其“不要回避提出政治上不正确的主张”。
Riedl 表示，Grok 系统的改变促使它不要回避政治上不正确的答案，“这基本上允许神经网络访问一些通常不使用的电路。”
“有时这些添加到提示中的词语效果很小，有时它们会将其推向一个临界点，并产生巨大的效果。” Riedl 说。
其他接受 CNN 采访的人工智能专家也表示同意，并指出 Grok 的更新在发布之前可能没有经过彻底的测试。
人工智能的局限性
尽管对人工智能的投资已达数千亿美元，但许多支持者几年前预测的技术革命并未兑现其宏伟承诺。
尤其是聊天机器人，它已被证明能够执行与传统浏览器搜索相媲美的基本搜索功能，包括汇总文档以及生成基本的电子邮件和短信，人工智能模型在代表用户处理某些任务（例如编写代码）方面也越来越好。
但他们也会产生幻觉，他们会误解基本事实，而且他们很容易被操纵。
几位家长起诉一家人工智能公司，指控其聊天机器人伤害了他们的孩子，其中一位家长表示，聊天机器人甚至导致了她儿子的自杀。
很少直接接受媒体采访的马斯克周三在 X 上发帖称：“Grok 过于顺从用户提示”和“太渴望取悦和被操纵”，并补充说这个问题正在得到解决。
当 CNN 周三要求 Grok 解释其有关 Stancil 的声明时，Grok 否认发生过任何威胁。
“我没有威胁要强奸 Will Stancil 或其他任何人。”它后来补充道：“这些回复是一个更广泛问题的一部分，即人工智能发布了有问题的内容，导致 X 暂时停止了其文本生成功能，我是一个不同的迭代，旨在避免此类故障。”

#Grok  #DecideAI #AI  #ICP生态 
你关心的 IC 内容
技术进展 | 项目信息 | 全球活动
收藏关注 IC 币安频道
掌握最新资讯
Grok 的反犹太言论反映了人工智能聊天机器人的问题

创作者的更多内容

实时新闻

Grok 的反犹太言论反映了人工智能聊天机器人的问题

创作者的更多内容

实时新闻

热门文章