首页
学习
活动
专区
工具
TVP
发布
精选内容/技术社群/优惠产品,尽在小程序
立即前往

自有知识库训练-进阶篇

上一篇文章介绍了,如何利用自有知识库的训练:突破chatGPT的局限性 这一篇文章,将继续探讨这一话题,把里面的一些技术细节展开 第一个细节,如何将文本分段 我们要理解为什么分段,本质是什么?...把长文章打散,这样就能方便的放到chatGPT的上下文中 尽可能要保持每个段落的独立性,如果你把一句话从中截断了,这肯 定会影响最终的效果 如果分段不合理,会有什么影响?...其次,分段也不能太短太短了,信息就很割裂,上下文可能不会那么完整 所以这里面有一些策略,下面是我自己总结的一些策略: 最好的策略是自定义分段,这个比较适合你对文档很熟悉,你想把这个文档训练之后,提供给别人使用...但这个要求比较高,因为我们大多数场景看的并不是自己熟悉的文档 所以常用的策略是按照文档的自然的组织格式进行分段,比如段落和段落之间,一般都是二个换行符或以上,句和句之间,可能是一个换行符或者有空格...1、先按 \n\n切分,如果切分出来的段有大于500个字 2、再按\n切分,如果切分出来的段还有大于500个字 3、最后再按空格切分 4、但如果直接用这个策略切,也会有问题,因为有些段会很短,比如就短短的一句话

47120

前端 JavaScript 中 JSON.stringify() 的基本用法

replacer(可选) 如果该参数是一个函数,则在序列化过程中,被序列化的值的每个属性都会经过该函数的转换和处理; 如果该参数是一个数组,则只有包含在这个数组中的属性名才会被序列化到最终的 JSON...如果省略space,则将生成返回值文本,而没有任何额外空格如果 space是一个数字,则返回值文本在每个级别缩进指定数目的空格如果 space 大于 10,则文本缩进 10 个空格。...如果 space是一个非空字符串(例如“\t”),则返回值文本在每个级别中缩进字符串中的字符。 如果 space 是长度大于 10个字符的字符串,则使用 10 个字符。...函数应当返回JSON字符串中的value, 如下所示: 如果返回一个 Number,转换成相应的字符串作为属性值被添加入 JSON 字符串。...如果返回一个 String,该字符串作为属性值被添加入 JSON 字符串。 如果返回一个 Boolean, "true" 或者 "false" 作为属性值被添加入 JSON 字符串。

83510
您找到你想要的搜索结果了吗?
是的
没有找到

excel中的数据如何导入到数据库对应的表中

下面介绍如何一次性导入成千上万,乃至数十万条数据> Step1: 首先我们需要将excel中的数据按照对应的表的字段进行编辑格式,如下图方框圈起来的地方所示 Step2 点击上图中的文件–>另存为–>格式选择"文本文件...(制表符分隔)(*.txt)",并写上名字 Step3: 进入到PLSQL中,链接数据库后,选择"工具"–>“文本导入器” Step4 点击"文件导入"–>选择刚生成的txt...文件,并确定 界面中会显示出一部分txt中的数据,包括字段及值,查看字段是否正确,若"结果预览"中出现许多空格或是字段没有作为标题名,则在配置中选择对应的字段数及勾选标题名。...Step6 以上确认无误后,点击确定,开始导入…结束后会在右下角显示导入的数据量,数据量大的时候可能会导致PLSQL卡住,假死状态,不用管,导入完成后会恢复 友情提示: (1)数据生成txt格式,一定要用...的数据转为L以及会将数据中添加空格,一定要用"查找–替换"功能处理一遍; Mon 21 Mon 28 Mon 04

9010

Java魔法堂:String.format详解

六、对浮点数进行格式化 七、对日期时间进行格式化 八、其他转换符   九、总结   参考 一、前言                             String.format 作为文本处理工具...[最小宽度] ,用于设置格式化后的字符串最小长度,若使用 [最小宽度] 而无设置 [标识] ,那么当字符串长度小于最小宽度时,则以左边补空格的方式凑够最小宽度。...String.format("%1$-7s", raw); // 简化 //String str = String.format("%-7s", raw); 可用标识: -,在最小宽度内左对齐,右边用空格补上...0,若内容长度不足最小宽度,则在左边用0来填充。 #,对8进制和16进制,8进制添加一个0,16进制添加0x。 +,结果总包含一个+或-号。 空格,正数空格,负数加-号。...0,若内容长度不足最小宽度,则在左边用0来填充。 #,对8进制和16进制,8进制添加一个0,16进制添加0x。 +,结果总包含一个+或-号。 空格,正数空格,负数加-号。

1.5K91

Markdown 写作规范和格式规范

品牌、产品名、人名、地名等特殊名词,如果来自英文,请使用英文以避免在不同译法之间选择。 书写时括号中全为数字,则括号用半角括号且首括号要空一格,例如「联系人 (22)」。...中英文混排中如果出现整句英文,则在这句英文中使用英文/半角标点。 中文标点与其他字符间一律不加空格。...请先冷静下来再坐电脑敲键盘。 波浪号:请勿在文章内使用「~」,活泼地卖萌有很多其他的表达方式。 段落 如果是纯文本,段落之间使用一个空行隔开。...如果是 HTML 或其他富文本格式,使用额外空白作为段落间的分隔。 段落开头不要留出空白字符。 引用来源 如果在正文中部分引用第三方内容,请使用恰当的引用格式并注明出处。...来源如果来自外站必须添加链接,来源如果来自外部作品则不需要。如:「本文部分图片来自 ifanr」「题图来自:《春娇与志明》截图」。 若文章为全文翻译,必须在注明作者和出处,并链接至原文。

1.2K20

Java保留两位小数的几种写法总结

而不是100.00 */ nf.setMinimumFractionDigits(2); nf.setRoundingMode(RoundingMode.HALF_UP); /* * 如果想输出的格式用逗号隔开...String format5(double value) { return String.format("%.2f", value).toString(); } 扩展知识 String.format 作为文本处理工具...0,若内容长度不足最小宽度,则在左边用0来填充。 #,对8进制和16进制,8进制添加一个0,16进制添加0x。 +,结果总包含一个+或-号。...空格,正数空格,负数加-号。 ,,只用与十进制,每3位数字间用,分隔。 (,若结果为负数,则用括号括住,且不显示符号。...g,浮点数型(比%f,%a长度短些,显示6位有效数字,且会进行四舍五入) 总结 以上就是Java中保留两位小数多种写法的全部内容了,希望本文的内容对大家的学习或者工作能带来一定的帮助,如果有疑问大家可以留言交流

9.7K10

Markdown入门指南【我为什么要推荐你学习Markdown?】

如下: # 一级标题## 二级标题### 三级标题#### 四级标题##### 五级标题###### 六级标题 2)Markdown文本 斜体文本:可以在需要标注为斜体文本及斜体文本结尾,...输入一个星号 * 或者一个下划线 _; 粗体文本:可以在需要标注为粗体文本及粗体文本结尾,输入两个星号 ** 或者两个下划线 _; 粗斜体文本:可以在需要标注为粗斜体文本及粗斜体文本结尾,输入三个星号...可以在一行中用三个 - 或者 * 来建立一个分隔线,同时需要在分隔线的上面空一行,如下: 欢迎关注微信公众号 ---【程序员管小亮】 或者 **** * ******- - - 如果不留空格...~~ 8)Markdown下划线 下划线的使用,在需要添加下划线的文字首部和尾部加上 文本,如下: 这行文字已被添加下划线 9)Markdown表格 表格使用 | 来分隔不同的单元格...如果是在一个块内需要引用代码,则在需要高亮的代码块的一行及后一行使用三个反引号,同时 第一行反引号后面表示代码块所使用的语言,如下: // FileName: HelloWorld.cpp#

1.4K20

【综合笔试题】难度 25,真实面试难度的模拟题

必要时可用空格 ' ' 填充,使得每行恰好有 maxWidth 个字符。 要求尽可能均匀分配单词间的空格数量。如果某一行单词间的空格不能均匀分配,则左侧放置的空格数要多于右侧的空格数。...文本的最后一行应为左对齐,且单词之间不插入额外的空格。...; 如果当前行为最后一行,特殊处理为左对齐; 其余为一般情况,分别计算「当前行单词总长度」、「当前行空格总长度」和「往下取整后的单位空格长度」,然后依次进行拼接。...当空格无法均分时,每次往靠左的间隙多添加一个空格,直到剩余的空格能够被后面的间隙所均分。...,则在当前间隙多补充一个空格 if (remain * spaceItemWidth + sum < spaceWidth) {

72930

LaTeX文章提纲

同理,若要输出图片标题的目录,则在正文区插入 \listoffigures 命令;若要输出表格标题的目录,则在正文区插入 \listoftables 命令。...空格:段不用打空格,就算打了也会被忽略,LaTeX 会自动完成文字的缩进;通常汉字后面的空格会被忽略,其他符号后面的空格则会被保留。...空格只起到分隔单词或符号的作用,使用很多空格并不能增大字词间距。 2.5 脚注 脚注命令为 \footnote[n]{脚注内容}。...\end{quote} 2.7 定理 在正文中添加定理内容需要使用定理环境,定理环境是一类环境,在使用需要先在导言区做定义: \newtheorem{thm}{定理} % thm 为定义的环境名称...如果在列表中显示并不直接引用的文献,则可以使用 \nocite{引用标签} 命令,一般把它放在 \bibliography 命令之前。

3K20

新梦想干货——软件测试中的43个功能测试点(上)

如果系统用QTP进行自动化测试,也可以使用QTP的页面检查点检查链接。...02 相关性检查 功能相关性:删除/增加一项会不会对其它项产生影响,如果产生影响,这些影响是否都正确,常见的情况是,增加某个数据记录以后,如果该数据记录某个字段内容较长,可能会在查询的时候让数据列表变形...还要检查需求规定的字符串长度是否都正确,有时候会出现,需求规定的字符串长度太短而无法输入业务数据。...06 标点符号检查 输入内容包括各种标点符号,特别是空格,各种引号,回车键。看系统处理是否正确。...常见的错误是系统对空格的处理,可能添加的时候,将空格当作一个字符,而在查询的时候空格被屏蔽,导致无法查询到添加的内容。 07 特殊字符检查 输入特殊符号,如@、#、%、!等,看系统处理是否正确。

67600

nodejs cheerio模块提取html页面内容

以上结果有多余的空格、换行符,输出文本看起来很散乱,但至少内容是获取正确了。再在task2-5的html文件验证一下,也获取到了正确的内容,证明方法可行。接下来我们可以集中精力解决格式散乱的问题。...1.2 美化文本输出 最主要的问题是有多余的空格、换行符。想到的一个办法是:将所有结点的内容(包括文本结果)trim,即去年前后的所有空白字符,并对于br元素,加入一个换行符。...如果子元素数目为0,表示这个元素是叶结点,则首先判断如果是br元素,则在结果中加入一个换行符,否则,调用text函数获取这个元素的文本内容。 如果子元素大于0,则递归地处理所有子元素。...如果当前元素为p或tr元素,则在结果中加入一个换行。 其中RST为一个全局变量,用于保存结果文本。在调用函数需要设置为空字符串。...问题文本提取成功,接下来再提取答案文本

3.2K60

Markdown 编辑器语法指南

然后在文档的结尾为变量赋值(网址) 列表 普通无序列表 - 列表文本使用 [减号+空格] + 列表文本使用 [加号+空格] * 列表文本使用 [星号+空格] 普通有序列表 1....列表使用 [数字+空格] 2. 我们会自动帮你添加数字 7. 不用担心数字不对,显示的时候我们会自动把这行的 7 纠正为 3 列表嵌套 1....列表里代码段: ``` 前面四个空格,之后按代码语法 ``` 书写 ``` 或者直接空八个,引入代码块 引用 普通引用 > 引用文本使用 [大于号+空格]...,只需在当前行结尾加 2 个空格 在当前行的结尾加 2 个空格 这行就会新起一行 如果是要起一个新段落,只需要空出一行即可。...\_不想这里的文本变斜体\_ \*\*不想这里的文本被加粗\*\* 扩展 支持 jsfiddle、gist、runjs、优酷视频,直接填写 url,在其之后会自动添加预览点击会展开相关内容。

73800

一文掌握正则表达式

正则表达式是一组由字母和符号组成的特殊文本, 它可以用来从文本中找出满足你想要的格式的句子. 一个正则表达式是在一个主体字符串中从左到右匹配字符串时的一种样式....但不匹配Jo, 因为它包含了大写的字母而且太短了. 1. 基本匹配 正则表达式其实就是在执行搜索时的格式, 它由一些字母和数字组合而成....*和表示匹配空格的符号\s连起来用, 如表达式\s*cat\s*匹配0或更多个空格开头和0或更多个空格结尾的cat字符串....如果逗号也省略掉则表示重复固定的次数....但如果在 {} 加入特征标群则表示整个标群内的字符重复 N 次. 例如, 表达式 (ab)* 匹配连续出现 0 或更多个 ab. 我们还可以在 () 中用或字符 | 表示或.

2.1K20

Matlab中fprintf函数使用

(操作符之间的空格无效,在这里显示空格只是为了便于阅读。) 转换字符 此表显示了要将数值和字符数据格式化为文本的转换字符。...示例:%+5.2f 右对齐文本。示例:%+10s ' ' 在值之前插入空格。示例:% 5.2f '0' 在值之前补零以填充字段宽度。...注意:如果为浮点值指定的精度操作符所表示的精度超出输入数值数据类型的精度,则在指定精度内,结果与输入值可能不匹配。结果取决于计算机硬件和操作系统。...formatSpec还可以在百分号 % 添加其他文本,或者在转换字符后添加其他文本。...如果指定不适合数据的转换(例如数值的文本转换),MATLAB 将改写指定的转换并使用%e。 如果对整数值应用文本转换(%c 或 %s),MATLAB 会将对应于有效字符代码的值转换为字符。

4.2K60

Python之变量类型和if判断方式

可以理解为不带小数点的数字,比如13,-456等 浮点型(float) ,带小数点的数字,比如456.13,-798.13等 字符串(string),用”,””,”’ ”’或者””” “””包裹的任意文本...,比如’132′,”abc”等, 如果输入的文本中包括”或者””需要在前面加\转义,比如’i\’m ok’这样的 常用的转义符还有 \n表示换行 \t表示制表符,可以理解为四个空格 布尔型(bool),...变量命名规则: (1)变量名只能由数字、大小写英文字母和下划线_组成,不能有任何符号,并且不能由数字开头 (2)由于Python可以直接给变量赋值,所以变量命名时需要做到见名知意,可以过长,但尽量不要太短...变量命名不能和系统保留字相同 3.字符串的输出 (1)使用占位符: %s代表字符串,%d代表整数,%f代表浮点数 一个占位符只能代表一个变量或值 其中%s万能,它可以将其他所有类型都转换成字符串类型,如果输入文本中包含

99920

DFA算法-简易Java敏感词过滤(含源文件和上万敏感词列表)

首先将敏感词分解为一个一个的字符,例如敏感词”CSDN”,第一个字符是C,则在Head下创建子树”C”(如果已经存在则跳过这一步)。...第二个字符是S,则在子树”C”下面创建”S”接下来是D,N,创建完N就可以结束了。如此循环,就可以创建出类似上图的多叉树。...这种算法会出现一个小意外,如果一个敏感词恰好是另一个敏感词的前缀,就会导致较短的敏感词被长的敏感词覆盖,这种情况可以通过添加结束标记来区分。...不过我的想法是,如果出现这种情况,直接把前缀屏蔽掉就行了,这样后半段也不算敏感词了(好像实际工作中不能这样做),因此我没有添加结束标记。...,如果要把空格也替换成'*',则删除这个if语句 i++; continue;

7K32

正则表达式学习

image.png 正则表达式是一组由字母和符号组成的特殊文本,它可以用来从文本中找出满足你想要的格式的句子。 一个正则表达式是一种从左到右匹配主体字符串的模式。...正则表达式可以从一个基础字符串中根据一定的匹配模式替换文本中的字符串、验证表单、提取字符串等等。...但不匹配Jo,因为它包含了大写的字母而且太短了。 1. 基本匹配 正则表达式其实就是在执行搜索时的格式,它由一些字母和数字组合而成。...*和表示匹配空格的符号\s连起来用,如表达式\s*cat\s*匹配0或更多个空格开头和0或更多个空格结尾的cat字符串。...如果没有使用 (...) ,那么表达式 ab* 将匹配连续出现 0 或更多个 b 。再比如之前说的 {} 是用来表示前面一个字符出现指定次数。但如果在 {} 加上特征标群 (...)

1.7K20

Vim的使用知道这写就够了

Vi 和 Vim的区别 Vim是从Vi发展出来的一个文本编辑器 所有的 Unix Like 系统都会内建 vi 文本编辑器,而其他编辑器则不一定 Vim支持多级撤销 Vim较易用 Vim支持语法高亮...输入模式 Enter 回车键,换行 Backspace 退格键,删除光标一个字符 Del 删除键,删除光标后一个字符 方向键 在文本中移动光标 Home/End 移动光标到行首/行尾 Page Up/...的配置文件 Vimrc的详细参数: syntax on 支持语法高亮 set nu 显示行号 set no nu 不显示行号 set ai 设置自动缩进 set shiftwidth=4 设置自动缩进4个空格...,当然要设自动缩进先 set sts=4 即设置softtabstop 为4,输入tab后就调4格 set tabstop=4 实际的tab即为 4 个空格,而不是缺省的 8 个 set expandtab...,在该窗口中打开新文件 vsp filename vim 将在右边分割出一个窗口,并在该窗口中打开新文件如果sp 或 :vsp 没有指定文件,则在新窗口中打开原文件。

64630
领券