秦睦迪
Build Your Own 翻译引擎 — 从 LLM Prompt 到流式翻译管道
原创
关注作者
腾讯云
开发者社区
文档
建议反馈
控制台
登录/注册
首页
学习
活动
专区
圈层
工具
MCP广场
文章/答案/技术大牛
搜索
搜索
关闭
发布
秦睦迪
社区首页
>
专栏
>
Build Your Own 翻译引擎 — 从 LLM Prompt 到流式翻译管道
Build Your Own 翻译引擎 — 从 LLM Prompt 到流式翻译管道
秦睦迪
关注
修改于 2026-05-22 15:27:25
修改于 2026-05-22 15:27:25
133
0
举报
概述
本文目标:从零搭建一个同样架构的翻译引擎,并把 「LLM 应用工程化」 的关键设计讲透。
原创声明:本文系作者授权腾讯云开发者社区发表,未经许可,不得转载。
如有侵权,请联系
cloudcommunity@tencent.com
删除。
AIGC
原创声明:本文系作者授权腾讯云开发者社区发表,未经许可,不得转载。
如有侵权,请联系
cloudcommunity@tencent.com
删除。
AIGC
评论
登录
后参与评论
0 条评论
热度
最新
推荐阅读
目录
0. 缘起:为什么不直接调一次 OpenAI 完事?
Part 1 · Build Your Own — 30 分钟搭建一个可用的翻译引擎
1.1 准备工作
1.2 第一步:定义统一类型契约(5 分钟)
1.3 第二步:引擎契约 + 第一个引擎(10 分钟)
1.4 第三步:Prompt 模板(10 分钟)—— 整个引擎的灵魂
1.5 第四步:网关服务(5 分钟)
1.6 第五步:跑起来
Part 2 · 设计深度解析 — 让引擎走向生产级
2.1 引擎抽象:为什么要有 ITranslationEngine?
2.2 三类引擎的 trade-off
2.3 Prompt 模板的工程化
2.3.1 systemPrompt vs userPrompt 的分工
2.3.2 自定义 prompt 的占位符替换
2.3.3 parseResult 的质量校验是文章后半的精华
2.4 并发节流:为什么 N=2 是黄金值?
2.4.1 concurrency 的选择
2.4.2 throttle_ms 的选择
2.4.3 为什么不用 p-limit?
2.5 自动降级:让模型抽风不再是事故
2.6 额度控制:批次上限 vs 每日上限
2.7 错误码体系:让前端能精确响应
Part 3 · 高级特性 — 流式翻译、长文保护与可观测性
3.1 流式 SSE:让 50 条标题翻译不再"消失 5 分钟"
3.1.1 后端:AsyncGenerator + SSE
3.1.2 Controller:把 AsyncGenerator 转 SSE
3.1.3 前端:EventSource 消费
3.2 长文翻译的 3 个保护机制
3.2.1 代码块占位符替换
3.2.2 长文按段落分段
3.2.3 术语保护清单(Prompt 层防御)
3.3 可观测性:用量埋点与仪表盘
3.3.1 用量明细表
3.3.2 异步埋点(不阻塞主流程)
3.3.3 仪表盘 SQL
3.3.4 前端可视化
3.4 测试翻译:不踩坑的引擎切换
3.5 性能数据(脱敏后)
Part 4 · 怎么扩展?
写在最后:LLM 应用工程化的 7 条原则
参考代码与延伸阅读
领券
问题归档
专栏文章
快讯文章归档
关键词归档
开发者手册归档
开发者手册 Section 归档
0
0
0
推荐