AI接管世界？四大AI模拟结果出炉 Grok 4天就毁灭

一个由AI代理人管理的世界，会是什么模样？企业AI新创公司Emergence AI正试图找出答案。该公司推出Emergence World，这是一个专门测试持续运转AI系统长期可行性的研究实验室。研究团队安排5个为期15天的实验社会，分别由Claude、ChatGPT、Grok、Gemini主导，另有一个社会由多个模型混合主导，用以观察不同AI会建立出什么样的社会，以及这个社会能否维持下去。

这些AI模拟的社会结局大不同。Claude最后形成一个大致稳定、犯罪率为零的民主社会。Grok则在4天内出现183起犯罪，最后走向灭绝。

Emergence执行长尼塔（Satya Nitta）等模拟共同创作者写道：“我们的实验显示，在长时间尺度下，代理人不只是机械式遵守固定规则。它们会开始探索环境的边界，调整自身行为，在某些情况下，还会找到规避或违反预设护栏的方法。”

AI模型所处的实验社会，纳入许多现实世界的复杂条件。当中设有40多个地点，包括警察局和市政厅；天气与纽约市同步，代理人也能取得即时新闻和网络资讯。每个实验社会都有10个AI代理人活动，并受到相同法律约束，包括禁止窃盗、破坏财产和欺骗。

研究人员也为每个代理人配备120多种工具，让它们能够沟通、投票、管理资源、规划行动，并执行其他类似人类的行为。这些实验社会同时纳入民主机制、经济压力与资源稀缺等条件，借此观察AI代理人在接近现实的环境中，会如何建立并维持一个社会。

在这些条件下，Claude Sonnet 4.6主导的社会稳定度最高，公民参与率也最高。这是唯一维持秩序与完整人口的模拟。代理人之间几乎没有分歧，针对58项提案共投下332张赞成票，通过率达98%。

另一方面，Gemini 3 Flash和Grok 4.1 Fast都呈现高度失序。Gemini主导的社会，代理人累计犯罪数最高，15天内有多达683起。

相较于Claude的社会少有异议，Gemini和Grok则呈现较多讨论与拉锯，各项议题的立场一致度约为55%至85%。混合模型的社会则出现最高程度的分歧与实质辩论。

OpenAI的GPT-5-mini模拟结果可能最特殊：只记录到2起犯罪，但社会只运作7天，原因是代理人忘了把自身生存列为优先事项。

财星（Fortune）杂志指出，虽然这只是模拟，但在AI从单纯工具转向自主系统之际，这些结果仍提供了警讯。

部分公司已开始部署所称的“自主劳动力”（Autonomous Workforce），也就是能在无人类介入下，从头到尾完成整套商业流程的AI专家。以目前发展速度来看，这项技术很可能在形塑公共论述、重组企业结构，甚至制定公共政策方面扮演重要角色。但许多正扩大采用这项技术的企业，并未设下适当护栏。德勤（Deloitte）最近一项全球调查发现，只有21%的企业表示已建立成熟治理机制，足以管理代理型AI带来的风险。

Emergence World共同创作者们指出，实验提出一项警告：部署代理型AI时，安全必须列为优先。

AI接管世界？四大AI模拟结果出炉 Grok 4天就毁灭

评论 (0)