200个AI代理模拟危机：市场定价与群体判断的背离揭示真实信号-币圈子

AI代理群体行为揭示真实风险判断

在对霍尔木兹海峡局势的模拟实验中，200个由MiroFish生成的代理角色——涵盖政府、媒体、能源公司、金融交易员及普通民众——在一个模拟的社交环境中持续互动、辩论与传播信息。经过7天共100轮的运行，系统生成了1,888条帖子与超过6,000次行为轨迹，呈现出接近真实舆论场的行为分布：多数时间用于观察与转发，少数产生原创观点。

群体自发判断与市场定价的分歧

模拟过程中，群体自然演化出的平均概率为47.9%，而Polymarket市场的定价为31%。两者间存在16.9个百分点的差距。值得注意的是，在自由发言阶段，有7位代理（包括伊朗外长、中国外长、经济学教授、反战活动人士等）给出≤30%的悲观判断，其平均值为22%，与市场结果极为接近。这些个体虽在数量上占少数，却展现出更高的预测准确性。

访谈模式下的表达收敛与信号失真

当模拟结束后对核心代理进行一对一采访，所有回答均趋于保守乐观，集中在60%至70%区间。这一转变表明，正式提问情境下，代理表现出明显的合作偏好与外交式表达，与自由发帖时的激烈争论形成鲜明对比。这反映出一种普遍存在的行为结构：公开表态往往趋向稳定与温和，而真正风险判断隐藏于非正式互动之中。

行动比言辞更能反映真实意图

该实验无意中复现了现实世界中的典型分裂——领导人公开宣称和平意愿，但其资产配置、军事部署或制裁行动却传递不同信号。同样，在模拟中，那些在私下互动中表达悲观的代理，其立场更贴近市场实际定价。因此，最有价值的信号并非来自共识，而是来自在噪音中显得不合群的声音。

未来优化方向：扩大规模与深化背景

当前实验已验证自然演化讨论优于正式访谈，且悲观者具备更高预测价值。下一步将引入更长期的历史数据，增强代理对地缘政治背景的理解；采用更强模型以减少默认乐观倾向；并进一步增加代理数量与多样性，使讨论结构更丰富，提升整体信号质量。参与者越多，讨论越复杂，最终形成的预测信号也越具参考价值。