Revert "Feat/parent child retrieval" (#12095)
This commit is contained in:
@@ -47,7 +47,6 @@ const translation = {
|
||||
notionSyncTitle: 'Notion 未绑定',
|
||||
notionSyncTip: '同步 Notion 内容前,须先绑定 Notion 空间',
|
||||
connect: '去绑定',
|
||||
cancel: '取消',
|
||||
button: '下一步',
|
||||
emptyDatasetCreation: '创建一个空知识库',
|
||||
modal: {
|
||||
@@ -100,16 +99,6 @@ const translation = {
|
||||
autoDescription: '自动设置分段规则与预处理规则,如果不了解这些参数建议选择此项',
|
||||
custom: '自定义',
|
||||
customDescription: '自定义分段规则、分段长度以及预处理规则等参数',
|
||||
general: '通用',
|
||||
generalTip: '通用文本分块模式,检索和回忆的块是相同的',
|
||||
parentChild: '父子分段',
|
||||
parentChildTip: '使用父子模式时,子块用于检索,父块用作上下文',
|
||||
parentChunkForContext: '父块用作上下文',
|
||||
childChunkForRetrieval: '子块用于检索',
|
||||
paragraph: '段落',
|
||||
paragraphTip: '此模式根据分隔符和最大块长度将文本拆分为段落,使用拆分文本作为检索的父块',
|
||||
fullDoc: '全文',
|
||||
fullDocTip: '整个文档用作父块并直接检索。请注意,出于性能原因,超过10000个标记的文本将被自动截断。',
|
||||
separator: '分段标识符',
|
||||
separatorTip: '分隔符是用于分隔文本的字符。\\n\\n 和 \\n 是常用于分隔段落和行的分隔符。用逗号连接分隔符(\\n\\n,\\n),当段落超过最大块长度时,会按行进行分割。你也可以使用自定义的特殊分隔符(例如 ***)。',
|
||||
separatorPlaceholder: '\\n\\n 用于分段;\\n 用于分行',
|
||||
@@ -122,22 +111,19 @@ const translation = {
|
||||
removeExtraSpaces: '替换掉连续的空格、换行符和制表符',
|
||||
removeUrlEmails: '删除所有 URL 和电子邮件地址',
|
||||
removeStopwords: '去除停用词,例如 “a”,“an”,“the” 等',
|
||||
preview: '预览',
|
||||
previewChunk: '预览块',
|
||||
preview: '确认并预览',
|
||||
reset: '重置',
|
||||
indexMode: '索引方式',
|
||||
qualified: '高质量',
|
||||
highQualityTip: '使用高质量模式进行嵌入后,无法切换回经济模式。',
|
||||
recommend: '推荐',
|
||||
qualifiedTip: '调用嵌入模型处理文档以实现更精确的检索,可以帮助LLM生成高质量的答案。',
|
||||
qualifiedTip: '调用系统默认的嵌入接口进行处理,以在用户查询时提供更高的准确度',
|
||||
warning: '请先完成模型供应商的 API KEY 设置。.',
|
||||
click: '前往设置',
|
||||
economical: '经济',
|
||||
economicalTip: '每个数据块使用10个关键词进行检索,不会消耗任何tokens,但会以降低检索准确性为代价。',
|
||||
economicalTip: '使用离线的向量引擎、关键词索引等方式,降低了准确度但无需花费 Token',
|
||||
QATitle: '采用 Q&A 分段模式',
|
||||
QATip: '开启后将会消耗额外的 token',
|
||||
QALanguage: '分段使用',
|
||||
useQALanguage: '使用 Q&A 分段,语言',
|
||||
estimateCost: '执行嵌入预估消耗',
|
||||
estimateSegment: '预估分段数',
|
||||
segmentCount: '段',
|
||||
@@ -167,15 +153,6 @@ const translation = {
|
||||
indexSettingTip: '要更改索引方法和 embedding 模型,请转到',
|
||||
retrievalSettingTip: '要更改检索方法,请转到',
|
||||
datasetSettingLink: '知识库设置。',
|
||||
previewChunkTip: '点击左侧的“预览块”按钮来加载预览',
|
||||
previewChunkCount: '{{count}} 预估块',
|
||||
switch: '切换',
|
||||
qaSwitchHighQualityTipTitle: 'Q&A 格式需要高质量的索引方法',
|
||||
qaSwitchHighQualityTipContent: '目前,只有高质量的索引方法支持 Q&A 格式分块。您要切换到高质量模式吗?',
|
||||
notAvailableForParentChild: '不支持父子索引',
|
||||
notAvailableForQA: '不支持 Q&A 索引',
|
||||
parentChildDelimiterTip: '文本分隔符是用于分隔文本的字符。建议用 \n\n 将原始文档划分为较大的父级片段。您也可以自定义特殊分隔符。',
|
||||
parentChildChunkDelimiterTip: '文本分隔符是用于分隔文本的字符。建议使用 \n 将父级片段拆分为较小的子级片段。您也可以自定义特殊分隔符。',
|
||||
},
|
||||
stepThree: {
|
||||
creationTitle: '🎉 知识库已创建',
|
||||
|
||||
Reference in New Issue
Block a user