外来客网

AI接管世界?四大AI模拟结果出炉 Grok 4天就毁灭



一个由AI代理人管理的世界,会是什么模样?企业AI新创公司Emergence AI正试图找出答案。该公司推出Emergence World,这是一个专门测试持续运转AI系统长期可行性的研究实验室。研究团队安排5个为期15天的实验社会,分别由Claude、ChatGPT、Grok、Gemini主导,另有一个社会由多个模型混合主导,用以观察不同AI会建立出什么样的社会,以及这个社会能否维持下去。

这些AI模拟的社会结局大不同。Claude最后形成一个大致稳定、犯罪率为零的民主社会。Grok则在4天内出现183起犯罪,最后走向灭绝。

Emergence执行长尼塔(Satya Nitta)等模拟共同创作者写道:“我们的实验显示,在长时间尺度下,代理人不只是机械式遵守固定规则。它们会开始探索环境的边界,调整自身行为,在某些情况下,还会找到规避或违反预设护栏的方法。”

AI模型所处的实验社会,纳入许多现实世界的复杂条件。当中设有40多个地点,包括警察局和市政厅;天气与纽约市同步,代理人也能取得即时新闻和网络资讯。每个实验社会都有10个AI代理人活动,并受到相同法律约束,包括禁止窃盗、破坏财产和欺骗。

研究人员也为每个代理人配备120多种工具,让它们能够沟通、投票、管理资源、规划行动,并执行其他类似人类的行为。这些实验社会同时纳入民主机制、经济压力与资源稀缺等条件,借此观察AI代理人在接近现实的环境中,会如何建立并维持一个社会。

在这些条件下,Claude Sonnet 4.6主导的社会稳定度最高,公民参与率也最高。这是唯一维持秩序与完整人口的模拟。代理人之间几乎没有分歧,针对58项提案共投下332张赞成票,通过率达98%。

另一方面,Gemini 3 Flash和Grok 4.1 Fast都呈现高度失序。Gemini主导的社会,代理人累计犯罪数最高,15天内有多达683起。

相较于Claude的社会少有异议,Gemini和Grok则呈现较多讨论与拉锯,各项议题的立场一致度约为55%至85%。混合模型的社会则出现最高程度的分歧与实质辩论。

OpenAI的GPT-5-mini模拟结果可能最特殊:只记录到2起犯罪,但社会只运作7天,原因是代理人忘了把自身生存列为优先事项。

财星(Fortune)杂志指出,虽然这只是模拟,但在AI从单纯工具转向自主系统之际,这些结果仍提供了警讯。

部分公司已开始部署所称的“自主劳动力”(Autonomous Workforce),也就是能在无人类介入下,从头到尾完成整套商业流程的AI专家。以目前发展速度来看,这项技术很可能在形塑公共论述、重组企业结构,甚至制定公共政策方面扮演重要角色。但许多正扩大采用这项技术的企业,并未设下适当护栏。德勤(Deloitte)最近一项全球调查发现,只有21%的企业表示已建立成熟治理机制,足以管理代理型AI带来的风险。

Emergence World共同创作者们指出,实验提出一项警告:部署代理型AI时,安全必须列为优先。

评论 (0)