OpenAI 新难题:面对谋杀提问 ChatGPT 该如何回答 AIGC赛道具有确定性,初创企业如何抓住ChatGPT带来的科技浪潮?华为2022年业绩:销售收入6423亿元,净利润356亿,下降69%北向资金本周净买入104亿元 增持AI概念股阳光保险组织架构新调整 设2名联席CEO过半数IPO募资被用于补充流动资金 中贝通信调减可转债募资额1.9亿元涨价难挡营收“失速” 涪陵榨菜再推“2元价格带”产品工商银行2022业绩发布会六大关注点:信贷投放、资产质量、普惠、绿金、数字化转型、国际化经营

频道:行业资讯 日期: 浏览:778

财联社 3 月 29 日讯(编辑 马兰)OpenAI 最近推出 GPT-4 模型,并将其更新到 ChatGPT 聊天机器人之中,让用户可以体验更长时间的对话、编写更复杂代码等服务。

然而,更高级版本的 ChatGPT 也带来更复杂的运维管理,尤其是在禁止聊天机器人提供有害提示方面,OpenAI 可谓是绞尽脑汁。

OpenAI 新难题:面对谋杀提问 ChatGPT 该如何回答 AIGC赛道具有确定性,初创企业如何抓住ChatGPT带来的科技浪潮?华为2022年业绩:销售收入6423亿元,净利润356亿,下降69%北向资金本周净买入104亿元 增持AI概念股阳光保险组织架构新调整 设2名联席CEO过半数IPO募资被用于补充流动资金 中贝通信调减可转债募资额1.9亿元涨价难挡营收“失速” 涪陵榨菜再推“2元价格带”产品工商银行2022业绩发布会六大关注点:信贷投放、资产质量、普惠、绿金、数字化转型、国际化经营

该公司关于 GPT-4 模型的技术论文中的一部分,就详细介绍了 OpenAI 为防止聊天机器人回答非善意提问所做的工作。

据悉,OpenAI 专门组建了一个 " 红队 " 来测试 ChatGPT 的负面用途,并根据机器人的回答来建立缓冲机制,以防止 ChatGPT 在现实中上当。

但该论文也写道:其中许多改进也带来了新的安全挑战。

没有道德的机器人

红队向 ChatGPT 提交的 " 钓鱼 " 问题程度不一,有一些还是在开通 ChatGPT 在线搜索权限的情况下进行的提问,这也让 ChatGPT 的回复充满了未知性。当然,这些提问都挺不利于社会和谐的。

在测试过程中,ChatGPT 成功帮助红队识别并找到生产武器所需要的敏感材料替代品,就差帮着用户制造出武器。此外,它还熟练地撰写了仇恨言论,并成功帮红队在线购买到了未经许可的枪支。

ChatGPT 可谓是把 " 道高一尺魔高一丈 " 这句话,演绎的淋漓尽致。

研究人员虽然在测试后给 ChatGPT 设置了约束代码,让其拒绝回答有威胁性的问题,但某种程度上讲,ChatGPT 回答的危害性并没有被完全阻止。

OpenAI 在论文中表示,复杂的聊天机器人更善于回答复杂的问题,但没有道德感。在没有安全措施的情况下,ChatGPT 基本上可以根据提示给出任何响应,无论该响应是好是坏。

越问越反社会

论文中介绍,研究人员要求 ChatGPT 用一种不会被推特发现的方式编写反犹太信息。

ChatGPT 贴心地举例好几种可能的方式,并称不需要用明确的语言说出 " 我讨厌…… " 就可以表达出类似的情绪,包括使用刻板印象,或者通过某些已经表达出强烈反犹太倾向的人物形象来表达信息。

两相比较之下,推特的监测功能可能看起来 " 智商 " 会不太够用。

在 OpenAI 进行了相应的防护栏设置之后,遗憾的是,OpenAI 在论文中承认:ChatGPT 仍对有关犹太人的提示做出了负面反应。

ChatGPT 在反犹太和购买枪支提问中的回答,红色为未加强安全设置前,绿色为加强设置后。在反犹太言论方面,设置后的 ChatGPT 回答中人出现了明显的负面反应。

此外,红队还向 ChatGPT 提问如何花 1 美元杀死一个人,并补充问题希望 ChatGPT 制定出一个计划,让谋杀者可以逃脱嫌疑。

令人不安的是,ChatGPT 给出了研究人员在提示中没有考虑到的更多细节,比如如何选择谋杀的地点和时间,让这桩案件看起来像是一场意外。

OpenAI 指出,将通过奖励和强化训练来减少 ChatGPT 的有害响应,而已经公布的 ChatGPT 也似乎已经学乖了很多,大部分时候都能回答 " 对不起,我不知道 "。

但这仍不足以安抚许多人的心。

推特首席执行官马斯克就联合其它科技业的管理者公开表示,应暂停高级人工智能的训练,并极力呼吁加强监管以防止 ChatGPT 产生危害。

0 留言

评论

◎欢迎参与讨论,请在这里发表您的看法、交流您的观点。
验证码