AI代理群体行为揭示真实风险判断

在对霍尔木兹海峡局势的模拟实验中,200个由MiroFish生成的代理角色——涵盖政府、媒体、能源公司、金融交易员及普通民众——在一个模拟的社交环境中持续互动、辩论与传播信息。经过7天共100轮的运行,系统生成了1,888条帖子与超过6,000次行为轨迹,呈现出接近真实舆论场的行为分布:多数时间用于观察与转发,少数产生原创观点。

群体自发判断与市场定价的分歧

模拟过程中,群体自然演化出的平均概率为47.9%,而Polymarket市场的定价为31%。两者间存在16.9个百分点的差距。值得注意的是,在自由发言阶段,有7位代理(包括伊朗外长、中国外长、经济学教授、反战活动人士等)给出≤30%的悲观判断,其平均值为22%,与市场结果极为接近。这些个体虽在数量上占少数,却展现出更高的预测准确性。

访谈模式下的表达收敛与信号失真

当模拟结束后对核心代理进行一对一采访,所有回答均趋于保守乐观,集中在60%至70%区间。这一转变表明,正式提问情境下,代理表现出明显的合作偏好与外交式表达,与自由发帖时的激烈争论形成鲜明对比。这反映出一种普遍存在的行为结构:公开表态往往趋向稳定与温和,而真正风险判断隐藏于非正式互动之中。

行动比言辞更能反映真实意图

该实验无意中复现了现实世界中的典型分裂——领导人公开宣称和平意愿,但其资产配置、军事部署或制裁行动却传递不同信号。同样,在模拟中,那些在私下互动中表达悲观的代理,其立场更贴近市场实际定价。因此,最有价值的信号并非来自共识,而是来自在噪音中显得不合群的声音。

未来优化方向:扩大规模与深化背景

当前实验已验证自然演化讨论优于正式访谈,且悲观者具备更高预测价值。下一步将引入更长期的历史数据,增强代理对地缘政治背景的理解;采用更强模型以减少默认乐观倾向;并进一步增加代理数量与多样性,使讨论结构更丰富,提升整体信号质量。参与者越多,讨论越复杂,最终形成的预测信号也越具参考价值。