检索增强生成(RAG)是将大语言模型与企业知识库连接的关键技术。然而构建可靠的RAG管道需要反复测试不同配置(分块策略、嵌入模型、检索技术等),传统手动管理方式...
大语言模型具有巨大潜力,但远非完美。最突出的痛点在于输出结果的不一致性——由于模型本质是概率性而非确定性的,即使输入完全相同也可能产生截然不同的输出。另一个众所...
近年来,大型语言模型(LLM)的出现加速了AI在各行业的应用。然而,为了进一步增强LLM能力并有效利用最新信息和领域知识,与外部数据源的集成至关重要。检索增强生...
面对万亿参数模型,传统全参数微调已成为资源黑洞。本文提出动态混合稀疏微调框架(DySparse),通过结构感知参数选择、梯度稀疏化压缩、神经路径蒸馏三大核心技术...
TextIn团队的文档解析测评工具Markdown Tester在Github发布后,我们陆续与大家探讨了目前业内对PDF解析工作的评判标准与我们各项测评指标的...