
Ryan Donovan: 大家好,欢迎来到Stack Overflow播客。今天我们将讨论第三方API以及如何将它们减少为单一调用,同时探讨其中的AI技术应用。我的嘉宾是Merge联合创始人兼CTO Gil Feig。
Gil Feig: 我们注意到在B2B领域,企业需要重复集成相同的API。比如会计软件需要与QuickBooks、Xero、NetSuite和Sage等多个平台集成。Merge通过"类别"概念解决这个问题——我们将软件垂直领域如HR、工单系统、文件存储、会计等归类,目前有七个快速增长的类别。
Gil Feig: 我们创建了一个经过设计的标准化数据模型,包含所有平台的通用字段,然后与所有平台集成并转换为统一格式。这比简单的字段映射复杂得多——有些平台没有完整对象概念,有些则有大量新增功能。
Ryan Donovan: 能解释一下"经过设计的"和"标准化"在数据模型中的含义吗?
Gil Feig: 以Jira和Asana为例。Jira可能有"title"字段,Asana可能有"name"字段。我们会将这些统一为类型字段。对于Jira特有的"epics"概念,我们创建通用分组对象并添加类型。我们无法包含每个平台的所有字段,否则API会变得极其稀疏——每个集成只返回20个字段,却有数千个字段定义。
Gil Feig: Merge采用数据同步机制。某些API一次请求就能获取100张发票的所有数据,而其他API需要先获取100个ID列表,然后为每个ID单独获取发票详情,导致100+次API调用,效率极低。我们通过后台持续同步,将数据转换为标准化格式,客户可随时检索。
我们区分初始同步和后续同步。初始同步可能对服务器造成压力,我们与API提供商密切合作改进访问模式。通过webhook向客户推送数据更新通知,而不是轮询。
Gil Feig: 如今我们可以使用AI研究不同API,但每个平台仍有大量细节需要注意。有些内容未文档化,用户实际使用平台的方式可能出人意料。API可能暴露"Epic"字段但从不填充,因为该功能已弃用。
关于MCP(Model Context Protocol),我们认为这是大家期待已久的协议。但当前MCP服务器构建质量参差不齐,很多是为了营销目的匆忙开发。MCP要真正起飞,需要第三方API提供更好的访问模式。
Gil Feig: 我们探索了多种AI代理链式调用方案。通过让代理相互调用,我们发现这是最轻量级且效果良好的方式。在新项目中,我们使用AI生成连接器,虽然仍需人工调整,但大大节省了时间。
为建立信任,我们让多个代理相互校验,直到获得相对可靠的解决方案。当生成的代码通过静态测试时,信任度会提高——但需要注意的是,AI编写的测试往往不够严谨。
Gil Feig: 未来API的关键在于访问模式的改进,而非协议本身。我们需要在API中实现语义搜索能力,而不仅仅是模糊匹配。如果每个API都有向量化查找端点,那将是革命性的。
理想API应包含:核心数据模型、批量操作、无需逐条查询(应支持分页和子模型扩展)、弹性搜索和语义搜索端点、丰富的webhook功能,以及数据删除通知机制(这对GDPR合规至关重要)。
本文基于Stack Overflow播客对Merge联合创始人兼CTO Gil Feig的访谈,探讨了API集成、数据标准化和AI应用的技术实践与未来展望。
原创声明:本文系作者授权腾讯云开发者社区发表,未经许可,不得转载。
如有侵权,请联系 cloudcommunity@tencent.com 删除。
原创声明:本文系作者授权腾讯云开发者社区发表,未经许可,不得转载。
如有侵权,请联系 cloudcommunity@tencent.com 删除。