首页
学习
活动
专区
圈层
工具
发布
社区首页 >专栏 >Build Your Own 翻译引擎 — 从 LLM Prompt 到流式翻译管道

Build Your Own 翻译引擎 — 从 LLM Prompt 到流式翻译管道

作者头像
秦睦迪
修改2026-05-22 15:27:25
修改2026-05-22 15:27:25
1330
举报
概述
本文目标:从零搭建一个同样架构的翻译引擎,并把 「LLM 应用工程化」 的关键设计讲透。

原创声明:本文系作者授权腾讯云开发者社区发表,未经许可,不得转载。

如有侵权,请联系 cloudcommunity@tencent.com 删除。

原创声明:本文系作者授权腾讯云开发者社区发表,未经许可,不得转载。

如有侵权,请联系 cloudcommunity@tencent.com 删除。

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
目录
  • 0. 缘起:为什么不直接调一次 OpenAI 完事?
  • Part 1 · Build Your Own — 30 分钟搭建一个可用的翻译引擎
    • 1.1 准备工作
    • 1.2 第一步:定义统一类型契约(5 分钟)
    • 1.3 第二步:引擎契约 + 第一个引擎(10 分钟)
    • 1.4 第三步:Prompt 模板(10 分钟)—— 整个引擎的灵魂
    • 1.5 第四步:网关服务(5 分钟)
    • 1.6 第五步:跑起来
  • Part 2 · 设计深度解析 — 让引擎走向生产级
    • 2.1 引擎抽象:为什么要有 ITranslationEngine?
    • 2.2 三类引擎的 trade-off
    • 2.3 Prompt 模板的工程化
      • 2.3.1 systemPrompt vs userPrompt 的分工
      • 2.3.2 自定义 prompt 的占位符替换
      • 2.3.3 parseResult 的质量校验是文章后半的精华
    • 2.4 并发节流:为什么 N=2 是黄金值?
      • 2.4.1 concurrency 的选择
      • 2.4.2 throttle_ms 的选择
      • 2.4.3 为什么不用 p-limit?
    • 2.5 自动降级:让模型抽风不再是事故
    • 2.6 额度控制:批次上限 vs 每日上限
    • 2.7 错误码体系:让前端能精确响应
  • Part 3 · 高级特性 — 流式翻译、长文保护与可观测性
    • 3.1 流式 SSE:让 50 条标题翻译不再"消失 5 分钟"
      • 3.1.1 后端:AsyncGenerator + SSE
      • 3.1.2 Controller:把 AsyncGenerator 转 SSE
      • 3.1.3 前端:EventSource 消费
    • 3.2 长文翻译的 3 个保护机制
      • 3.2.1 代码块占位符替换
      • 3.2.2 长文按段落分段
      • 3.2.3 术语保护清单(Prompt 层防御)
    • 3.3 可观测性:用量埋点与仪表盘
      • 3.3.1 用量明细表
      • 3.3.2 异步埋点(不阻塞主流程)
      • 3.3.3 仪表盘 SQL
      • 3.3.4 前端可视化
    • 3.4 测试翻译:不踩坑的引擎切换
    • 3.5 性能数据(脱敏后)
  • Part 4 · 怎么扩展?
  • 写在最后:LLM 应用工程化的 7 条原则
    • 参考代码与延伸阅读
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档