Coinbase采用中国开源模型大幅压缩AI开支

美国加密货币交易平台Coinbase正通过引入中国开源人工智能模型,实现其生产基础设施的显著成本优化。在顶级闭源模型服务费用持续上升的背景下,公司已将智谱AI的GLM 5.2与北京月之暗面开发的Kimi 2.7设为工程师默认使用的语言模型,有效降低整体AI支出。

智能路由与缓存机制提升运行效率

Coinbase构建了基于自定义调度框架的智能路由系统,根据提示词预处理结果、缓存命中率及模型定价,自动分配任务至最优模型。同时,通过积极缓存策略,将请求复用率从5%提升至60%,显著减少重复计算开销。

上下文精简助力成本控制

为避免无效token消耗,公司建议工程师在切换任务时开启新会话、缩小文件上下文范围,并及时断开未使用工具连接,从而实现对“被浪费的token”精准控制,而非单纯限制总量。

多模型并行保障输出质量

在代码审查等关键环节,平台采用多模型并行校验机制,确保输出结果的准确性与可靠性。对于复杂推理或规划任务,仍可自由选用前沿闭源模型,兼顾性能与成本平衡。

以效率驱动可持续扩展

Coinbase首席执行官Brian Armstrong强调,此次调整核心逻辑是“效率优先,而非压制使用”。工程师仍可自由调用任意模型与数量的token,但公司已建立使用量与业务影响挂钩的可视化机制,推动资源投入产生实际价值。该方法论具备广泛适用性,适用于各类企业实现AI应用的可持续发展。