🖼️ 图文卡片 🏠 返回首页
FINTECH FRONTIER INSIGHT

前沿科技洞见 · 2026-05-26

Copilot创始工程师:大多数AI编码工具选型像"开法拉利买牛奶"
资料提供:前沿科技研究部
很多事正在发生,这件帮你看过了

核心判断

GitHub Copilot 创始工程师 Neel Sundaresan 公开指出:大量开发者对 AI 编码工具的使用方式存在根本性的成本错配——用 $40/百万Token 的顶级模型做简单任务,资源配置严重浪费。而他在 IBM 打造的 Bob 系统,用模型自动路由解决这个问题。

发生了什么

开法拉利买牛奶

Sundaresan 现任 IBM 软件部自动化与 AI 总经理,是 GitHub Copilot 的创始工程师。他在接受《The New Stack》深度访谈时表示,太多企业和开发者习惯用最强的模型处理最简单的任务。他举了一个具体的例子:用 Claude Opus 4.7(输出价格 $40/百万Token)执行一条简单的提示词,而这些任务用更小的模型完全可以完成。

"这就好比开着法拉利去便利店买牛奶,完全没有必要。"

Sundaresan 从 2000 年就开始研究开发者效率问题,远早于 Transformer 和 LLM 的出现。他的第一个系统不是代码生成,而是一个 API 调用推荐系统——目标是在开发者按下点号时给出正确的函数调用推荐,本质上是代码补全场景的搜索排序问题。他说开发者很喜欢这个工具,而"在开发流程里某个细微环节降低使用阻力就能收获超乎预期的用户满意度"这一洞察,至今仍在影响他的产品思考。

Bob 的做法:不暴露底层模型

Sundaresan 在 IBM 打造的 Bob 智能编码工具已有 8 万名 IBM 内部开发者使用。与 Copilot、Cursor 等产品不同,Bob 不向用户暴露底层模型。它根据实际任务需求自动调度路由,可选模型包括 Anthropic Claude、Mistral 开源模型、IBM Granite 及多款定制微调的专有模型。

Sundaresan 说这并非简单地将各类模型接入系统,而是把模型能力、产品体验和架构有机结合起来,模型只是整体方案的一部分。

在 IBM 内部用户群体中,他的团队持续做 A/B 实验:测试前沿模型变体、监测用户使用模式、识别高成本模型被滥用于简单任务的场景。

内部部署 = 先吃自己的狗粮

Bob 被称为 IBM 的"零号客户"产品:在对外销售之前,先在 IBM 内部近两万名软件部门员工中部署。这个规模庞大、多元、愿意容忍早期缺陷换取效率提升的固定用户群体,给了 Sundaresan 任何外部产品发布都无法提供的东西。

IBM 内部开发者的技术栈极为多元:Python、Rust,也有 PL/I、COBOL、大型机 JCL,以及被他形容为"行业俚语一般的自定义语言"。只要 Bob 能适配这个范围,就能应对各类企业客户的任意开发场景。

为什么值得关注

Sundaresan 的观点触及了当前 AI 编码工具市场的核心矛盾:模型能力竞赛掩盖了成本效率问题。

目前主流产品(Copilot、Cursor、Windsurf 等)大多让用户手动选模型,或者默认使用最强的。用户缺乏自动路由能力,也缺乏成本可见性。Sundaresan 指出的 $40/百万Token vs 简单任务的错配,对于大规模部署 AI 工具链的企业——尤其是金融机构——是一个直接影响运营成本的工程决策点。

他还有另一个提醒:91% 失败的 AI 项目,问题不在模型,而在于规范缺失。企业以为和前沿模型提供商签个协议就够了,但事实并非如此。"在集成到软件产品之前,你需要遵循已有的规范,"他说。

可能影响

Sundaresan 的表态可能推动 AI 编码工具厂商在产品中加入自动模型路由功能,让产品根据任务复杂度自动选择不同成本和能力的模型。

对于有大量开发者团队、需要控制 AI 工具链成本的企业客户,这个方向会直接影响采购和部署决策——不只是看模型 benchmark 分数,还要看能否避免"开法拉利买牛奶"式的资源浪费。

参考文章未涉及 Bob 的具体定价或对金融机构私有化部署的直接建议。

参考资料

图文卡片 ⬇️ 一键下载图文卡片