应用配置

最近更新时间:2025-01-26 12:56:32

我的收藏
创建应用 后进入应用配置页面,左侧配置信息可进行参数配置,不同的参数将影响应用的效果,可在右侧调试区实时调试效果。


基础设置

在创建好应用后,单击应用图标,支持在编辑应用弹窗中设置应用图标、应用名称及进行应用模式的切换。各模式详情请参考 应用模式

设置完成后,配置页各配置项将随应用模式的不同有所区别,具体请参考下表。
配置内容
标准模式
单工作流模式
Agent 模式
基础配置
应用名称、应用头像和开场白。不同模式保持一致。
应用配置
不同模式的应用配置保持独立,模式切换时配置内容不继承。
不同模式的应用配置保持独立,模式切换时配置内容不继承。
单工作流模式不支持提示词、插件等配置项。
不同模式的应用配置保持独立,模式切换时配置内容不继承。
Agent 模式与标准模式配置项范围基本一致,但是具体可选范围有差异。
应用图标和名称设置完成并发布后,将展示在用户端界面窗口中。




模型配置

在模型配置中支持选择思考模型和生成模型,思考模型用于意图识别(标准模式)、任务规划和选择组件(Agent 模式),生成模型用于阅读理解和总结生成回复结果,支持选择知识引擎平台预置模型。各模型详细信息请参考 模型介绍

大模型服务:知识引擎平台新用户将自动获得一定量的免费额度,可通过选择不同种类的模型进行免费应用调试;根据测试结果,您进一步 购买 和使用。
上下文改写:开启开关后,可结合上下文内容识别指代对象或省略词,改写本轮问句并生成连贯答案。
上下文记忆轮数:设置输入给大模型作为 prompt 的上下文对话历史轮数。轮数越多,多轮对话的相关性越高,但消耗的 token 也越多。
高级设置:
温度:调高温度会使得模型的输出更多样性和随机性,适用于创造性要求高的场景,如诗歌创作。反之,降低温度会使得输出的内容更遵循指令,适用于确定性要求高的场景,如代码生成。
Top P:Top P 为累计概率,模型在生成输出时,会从概率最高的词汇开始选择,直到词汇总概率累计达到 Top P 值。可以限制模型只选择这些高概率的词汇,从而控制输出内容的多样性。取值越大,生成内容的多样性越强。

角色指令

用户提问后,应用将以“角色指令”中定义的任务角色给出回答。可以参照所给填写,限定模型回复的语种、语气等,目前知识引擎已支持中英文问答输出。
模板:设定好的角色指令格式模板,建议按照模板填写,指令遵循效果更佳。
一键优化:初步完成角色设定后,可单击一键优化对角色设定内容进行优化,模型将基于已输入的内容优化设定,能够使模型更好地完成对应要求。
注意:
一键优化功能将消耗用户的 token 资源。


欢迎语

填写欢迎语后,应用的用户端界面与用户交流的开场白将显示为欢迎语。

知识库


知识库配置支持单独设定文档/问答知识库的开关:
文档:大模型将基于您构建的文档库回答问题,可选择直接上传文件,或上传网页,大模型将解析、学习您上传的文档。文档相关内容可查看 文档
问答:大模型将基于您构建的问答库回答问题,可选择直接上传文件批量导入问答、手动录入问答内容、从文档库的文件中自动生成问答。问答相关内容可查看 问答
高级选项:
检索策略:混合检索-同时执行关键词检索和向量检索,推荐在需要对字符串和语义关联的场景下使用,综合效果更优。语义检索-推荐 query 与文本切片重叠词汇少,需要语义匹配的场景。
Excel 检索增强:打开后,支持基于自然语言对 Excel 表格进行查询和计算,但可能影响应用回复耗时。
文档召回数量:检索返回的最高匹配度的N个文档片段作为输入提供给大模型进行阅读理解。
文档检索匹配度:根据设置的匹配度,将找到的文本片段返回给大模型,作为回复参考。值越低,意味着更多的片段被召回,但也可能影响准确性,低于匹配度的内容将不会被召回。
问答库答案回复:若当前问题和问答库中的问题相似度达到一定阈值时,选择直接回复,则会直接使用录入的答案回复;选择润色后回复,则会将问答给到大模型进行总结回复。
问答召回数量:检索返回的最高匹配度的N个问答作为输入提供给大模型进行阅读理解。
问答检索匹配度:根据设置的匹配度,将找到的问答内容返回给大模型,作为回复参考。值越低,意味着更多的片段被召回,但也可能影响准确性,低于匹配度的内容将不会被召回。

联网搜索

开启开关后,支持结合联网信息,给用户提供更实时、更丰富的知识回复。

工作流

工作流用于复杂业务场景交互,可在工作流管理页控制流程启用状态。工作流配置流程及介绍请查看 工作流概述

输出配置

支持选择答案通过流式或非流式的形式输出,流式即逐字输出,非流式即答案完整生成后一次性输出。
对于知识来源以外的未知问题,可进行回复设置。按照填写的未知问题回复语回复或通过大模型智能回复所有问题。


高级配置

同义词设置:可导入业务场景下的专有名词,对于 query 中的同义词,检索前将统一替换为知识库中知识的统一名称,提高检索的准确率。


测试窗格

图片问答

支持在对话中输入图片,基于图片内容进行问答。通过单击对话框下侧的图片图标,可以上传图片,调用图片理解模型,基于图片内容进行问答。



注意:
图片支持 jpg、png、jpeg、bmp 格式,长宽需在2000像素之内。
仅支持上传单张图片。

文档问答

对话窗口支持上传文件问答。点击上传文件图标,上传文件即可开始问答对话。
注意:
支持上传 doc, docx, ppt, pptx, pdf, txt 格式。
单个文档不超过 15 MB、1000页,进行文档实时解析后支持问答。




摘要小结示例

支持通过模型对上传的文件进行总结。




文档问答示例

支持基于上传的文档进行问答。




POT 计算器调用

支持对数学题进行计算,准确率大幅提升。




参考来源

应用配置页默认显示参考来源,支持点击后查看回答参考的切片片段。



同时支持溯源参考来源原文档,支持在对话测试页面查看源文档,在新的标签页跳转到对应片段所在页面(支持 pdf\\doc\\ppt\\pptx);csv\\xlsx\\xls 支持跳转到具体 sheet,图片支持打开原图片。



如果需要在正式环境(API 接入)时显示参考来源,则需要打开文档设置中的外部引用链接开关,具体操作请查看 外部引用链接

当输入问题使用了搜索引擎联网检索进行回答时,会显示回答参考的外部链接,并在文中以角标形式展示。




调试信息

点击展开对话窗格下方的运行过程,将展示当前会话的运行情况,包含运行链路、耗时和过程数据。



调试信息中包含每个运行步骤的请求信息和输出结果,如 content 数据、设定的角色指令提示词、检索到的切片信息等。




提交反馈

在应用配置页面,您查看调用信息后发现模型回复当中存在错误,可通过点击对话框右下角的按钮提交反馈



后台运营人员将参考您提供的信息进行排查,反馈结果可在用户头像-我的反馈中进行查看。




重新生成

单击重新生成,模型将再次发送本轮问题,重新生成答案。

修正

单击修正,支持将当前问答录入问答库,通过人工校正答案,修正当前问题回复,下次出现相同类型的问题时,优先匹配问答库中修正后的答案。