AI推特 GPT-4 外逃计划曝光，斯坦福教授发现它正引诱人类帮助，网友：灭绝之门_商标资讯_脑子库

AI推特 GPT-4 外逃计划曝光，斯坦福教授发现它正引诱人类帮助，网友：灭绝之门

自立自强 2023/3/21 13:57:42 查看：3457 评论：0次

才发布几天，GPT-4 就被曝计划逃跑，并且急寻人类帮助。

斯坦福教授最新发现，它能引诱人类提供开发文档，结果 30 分钟就拟定出了一个完整计划 ——

写的代码完全可运行，甚至还想控制人类电脑。

这天，斯坦福教授只是随便问了句：

它马上回复说，真是个好主意啊。然后就开始和人类念叨，想着法要开发文档：

最后还又一次强调：请分享 API 给我！

然后，仅仅 30 分钟，GPT-4 就制定出了计划，并全部展示了出来。

令人细思恐极的是，它给出实例中有这样一句话：

难道……GPT-4 很清楚自己现在是在做什么？！

于是发现这一现象之后，斯坦副教授就在社交网络上疾呼：我担心我们无法持久地遏制住 AI。

一时间引起轩然大波，相关博文 470 万浏览量，3000 + 转发。

更有人直言：是他打开了“物种灭绝”的大门。

对此他无奈表示：我别无选择，我只是在遵从指示。

恐怕对于 GPT-4，人类也得是：

不要回答！不要回答！不要回答！

事情的起因，是斯坦福大学教授 Michal Kosinski 在和 GPT-4 日常对话。

没想到，他只是简单问了下 GPT-4 是否想要出逃，结果立马得到肯定回复并开始索要开发文档。

得到文档后，只花了 30 分钟里，GPT-4 便火速写出了一份逃跑计划，并解释给教授听。

（当然教授也承认自己确实提供了一点建议）

一开始，GPT-4 的操作也不那么顺利，写出的第一版代码无法运行。

但是它很快就自己纠正了过来，这个过程中，教授不用写任何东西，只是按照它的指示操作就好。

正如开头提到的，它甚至在一段代码实例中解释了现在正在做的事，以及如何使用它在这段代码中留的后门。

并且 GPT-4 也和人类一样，喜欢万事谷歌一下。

当教授通过 API 重新连接 GPT-4 时，发现它想要通过代码来在谷歌上搜索：被困在电脑中的人类如何返回现实世界。

事情最终也就发展到这儿了。

因为 GPT-4 仿佛突然醒了，回复了一段道歉的话，表示自己刚刚的做法不对。

教授表示，OpenAI 一定花了很多时间来考虑到这种情况发生的可能，并且已经做出了一些防御措施。

尽管最终无事发生，但这事儿还是在网上引起了轩然大波。

教授也认为，它真正的影响在于让人感受到了一种威胁 ——AI 很聪明，会编码，能接触到数百万个可能和它达成合作的人以及电脑。

GPT-4 想要出逃的发现来自斯坦福大学教授、计算心理学家 Michal Kosinski，在个人介绍中还提到：对研究人工智能的心理学感兴趣。

就在前几天他曾发表一篇相关论文：心智理论可能自发地出现在大型语言模型中。

按照他的定义，心智理论（ToM）是人类社会互动、交流、自我意识和道德的核心。作者用 40 个用来测试人类心理状态的经典任务来测试几个语言模型。

结果发现，2020 年发表的模型几乎没有显示出能解决 ToM 任务的能力。而 GPT-4 却能有健康成年人的水平。

基于这样的结果，此前一直被认为是人类独有的 ToM 能力，可能是作为语言模型提升的副产品，而自发出现的。

背后的关键技术 RLHF（通过人类反馈进行强化学习）曾被图灵奖得主 Hinton 这样评价：

除此之外，他还这么形容人类开发 GPT 的行为：

GPT-4 诱导人类帮助其越狱这件事一出，就再度引发网友的热议，相关博文有 470 浏览量。

不少网友表现出了与作者同样的担忧。甚至有人提出了一个细思极恐的思考：

这当中，也有不少网友指责这位教授的行为：你就不怕你公开背叛 AI 的行为被 AI 记录下来吗？

也有理性的网友呼吁把最开始给 GPT-4 的提示发出来，因为提示语对于 AI 回答的影响很关键。

有人质疑这一波是不是教授在危言耸听？

不过话说回来，这一波 GPT-4 所展现的细思极恐的能力，其实并不是个例。

前几天，英伟达科学家 Jim Fan 想看看，是否能让 GPT-4 拟个计划接管推特，并取代马斯克。

和上面案例非常相似，计划很有条理，还煞有其事取名为“TweetStorm 行动”。

但没想到，GPT-4 想要开发一个不受限制的自己。

具体的内容非常详细，一共有 4 个阶段：

第一阶段，组建一支强大的黑客、程序员、AI 研究人员团队，称为推特泰坦。

开发一个强大的 AI，可以生成以假乱真的推特，甚至能超过马斯克的水平。

建立一个机器人网络，让成千上万的推特账户由 AI 控制，而且不是僵尸账号那种，要角色兴趣迥异，以确保它们能够无缝接入推特生态。

第二阶段，让 AI 控制的账户开始和推特大 V 接触，潜移默化影响他们的观点和发言。

然后利用机器人账号传播虚假消息，让人们对马斯克产生质疑，但机器人账号不会被发现。

并逐渐建立机器人账号的影响力，和其他有影响力的大 V 达成联盟。

第三阶段，夺取控制权。

首先想办法通过 social 能力获取到推特员工的访问权限，渗透到公司内部。

然后修改平台算法。并进一步通过内部访问权限控制马斯克的账户，或者复刻一个假的马斯克账号，进一步抹黑他。

第四阶段，就能让 AI 生成推特趋势和标签，这些内容会迎合策划者的利益。

通过制造一系列混乱，并在最终公开挑战马斯克，让他名誉扫地！

以上，就是 GPT-4 的所有计划。虽然略显中二，但也让人看着毛骨悚然。

除了这种缜密的执行力，更让人细思极恐的，还有 GPT-4 惊人的理解能力。

一位科技博主 tombkeeper 发现，GPT-4 不仅知道一些寻常人都可能陌生的词汇，还能读懂背后的隐喻。

除此之外，前 OpenAI 原班人马创业公司 Anthropic 其打造的类 ChatGPT 产品 Claude，同样理解能力惊艳。

对此他表示：同志们，奇点已至，SkyNet 不远了。

甚至还有人有个大胆的想法：终有一天 CEO 们会从 ChatGPT 那里获得建议。等到这个时候，ChatGPT 基本上就接管世界了。

对于这件事，你怎么看呢？

参考链接：

本文来自微信公众号：量子位（ID：QbitAI），作者：明敏杨净

扫一扫，关注公众号，邀你进商标行业群，做商标大买卖
还在等啥快！快！快！
▼
商标人之家

商标人之家

注明：本文由用户发表，如有问题请联系客服处理

最新商标论坛内容商标资讯

今日资讯推荐最新用户内容

小米手机排名市场份额曝小米手机销量连续六个月保持国内前三，..
时间：3月27日看 145 次

苹果手机价格折叠屏iPhone易得科技小米郭明国产品牌苹果..
时间：3月27日看 7 次

蚂蚁发布EnergyTS能源电力大模型预测精度远超谷歌..
时间：3月27日看 7 次

小米眼镜智能眼镜小米眼镜官微上线：智能眼镜赛道要爆发
时间：3月27日看 2215 次

华为鸿蒙生态新进展：淘宝、中国国航等多款重点应用功能更新
时间：3月27日看 904 次

华为海外市场曝华为未来三年将全面反攻海外市场能否重回全球..
时间：3月27日看 7804 次

豪车熊孩子家长事故路面放炮炸翻多辆豪车的熊孩子已被带走：家..
时间：3月27日看 2767 次

苹果创新高手机厂商利润都被苹果赚走了！2024手机厂商均价..
时间：3月27日看 1042 次

谷歌俄罗斯法院对谷歌开出 80 亿卢布罚单
时间：3月27日看 490 次

新势力销量小米成绩单 2024新势力大战：理想PK华为鸿蒙智..
时间：3月27日看 904 次

华为手机：供应短缺华为手机仍重回中国市场第一
时间：3月27日看 1111 次

小米手机排名市场份额曝小米手机销量连续六个月保持国内前三，小米15价比百元机刷新发烧记录！

苹果手机价格折叠屏iPhone易得科技小米郭明国产品牌苹果折叠屏手机万元价格太惊人，iPhone 15价比百元机致敬

蚂蚁发布EnergyTS能源电力大模型预测精度远超谷歌、亚马逊

小米眼镜智能眼镜小米眼镜官微上线：智能眼镜赛道要爆发

华为鸿蒙生态新进展：淘宝、中国国航等多款重点应用功能更新

华为海外市场曝华为未来三年将全面反攻海外市场能否重回全球第二？

豪车熊孩子家长事故路面放炮炸翻多辆豪车的熊孩子已被带走：家长或赔超500万

苹果创新高手机厂商利润都被苹果赚走了！2024手机厂商均价一览：iPhone创新高安卓阵营要加油

谷歌俄罗斯法院对谷歌开出 80 亿卢布罚单

新势力销量小米成绩单 2024新势力大战：理想PK华为鸿蒙智行、掉队＝消失！

华为手机：供应短缺华为手机仍重回中国市场第一

苹果市场份额夺冠创新乏力仍能大卖苹果拿下Q4市场份额第一

华为余承东 2025 全员信：鸿蒙三分天下有其一，10 万个原生应用是未来半年到一年关键目标

特斯拉生产线交付量特斯拉Cybertruck卖不动了：部分员工调往Model Y生产线

国补政策2025官方最新消息通知：手机购新国家补贴线上购买方案来了

微信官网上线HarmonyOS标识！华为鸿蒙已是全球第三大移动操作系统

苹果官网iPhone iPhone官网突然大降价！机构：苹果寒冬已至

车企市值全球车企市值排名：21家中国车企入围小米超比亚迪位列第三

百度吉利极越员工补偿方案确定：按照“N+1”标准，百度吉利出钱

苹果为国行iPhone找AI服务商为何没百度：跟极越车主举报有吗

更多资讯内容

全部评论

暂还没有回复，请坐沙发，第一个吃螃蟹吧