|
11 | 11 | ## 功能价值 |
12 | 12 |
|
13 | 13 | ### 核心问题 |
| 14 | +!!! Abstract "" |
14 | 15 |
|
15 | | -在中文分词中,专业术语常常被错误拆分: |
16 | | - |
17 | | -| 术语 | 错误拆分 | 正确处理 | |
18 | | -|------|-------|------------| |
19 | | -| 小米手机 | 小米、手机 | 小米手机(作为整体) | |
20 | | -| 苹果手机 | 苹果、手机 | 苹果手机(作为整体) | |
21 | | -| 人工智能 | 人工、智能 | 人工智能(作为整体) | |
| 16 | + 在中文分词中,专业术语常常被错误拆分: |
| 17 | + |
| 18 | + | 术语 | 错误拆分 | 正确处理 | |
| 19 | + |------|-------|------------| |
| 20 | + | 小米手机 | 小米、手机 | 小米手机(作为整体) | |
| 21 | + | 苹果手机 | 苹果、手机 | 苹果手机(作为整体) | |
| 22 | + | 人工智能 | 人工、智能 | 人工智能(作为整体) | |
22 | 23 |
|
23 | 24 | ### 应用价值 |
| 25 | +!!! Abstract "" |
24 | 26 |
|
25 | | -- **精准匹配**:确保专业术语作为完整单元进行检索 |
26 | | -- **召回率提升**:避免因术语拆分导致的漏检 |
27 | | -- **行业适配**:支持企业自定义行业术语词典 |
| 27 | + - **精准匹配**:确保专业术语作为完整单元进行检索 |
| 28 | + - **召回率提升**:避免因术语拆分导致的漏检 |
| 29 | + - **行业适配**:支持企业自定义行业术语词典 |
28 | 30 |
|
29 | 31 |
|
30 | 32 |
|
|
48 | 50 |
|
49 | 51 |
|
50 | 52 | ### 注意事项 |
51 | | - |
52 | | -- 自定义词语生效范围:仅对**全文检索**和**混合检索**生效 |
53 | | -- 添加新术语后需重新执行分词索引才能生效 |
54 | | -- 词语支持范围:建议使用纯中文术语,避免包含空格、特殊字符 |
| 53 | +!!! Abstract "" |
| 54 | + - 自定义词语生效范围:仅对**全文检索**和**混合检索**生效 |
| 55 | + - 添加新术语后需重新执行分词索引才能生效 |
| 56 | + - 词语支持范围:建议使用纯中文术语,避免包含空格、特殊字符 |
55 | 57 |
|
56 | 58 | ## 技术原理 |
57 | 59 |
|
58 | 60 | ### 检索流程 |
| 61 | +!!! Abstract "" |
| 62 | + |
| 63 | + 用户提问 → 读取术语库 → 配置分词器 → 分词处理 → 匹配检索 |
59 | 64 |
|
60 | | -``` |
61 | | -用户提问 → 读取术语库 → 配置分词器 → 分词处理 → 匹配检索 |
62 | | -``` |
63 | 65 |
|
64 | 66 | ### 缓存机制 |
65 | 67 |
|
66 | 68 | 系统会缓存已配置的分词器实例(有效期1小时),避免重复创建,提升检索性能。 |
67 | 69 |
|
68 | 70 | ### 适用检索模式 |
| 71 | +!!! Abstract "" |
69 | 72 |
|
70 | | -| 检索模式 | 是否生效 | 说明 | |
71 | | -|---------|---------|------| |
72 | | -| 全文检索 | ✓ | 基于关键词匹配,使用分词器 | |
73 | | -| 混合检索 | ✓ | 全文检索部分使用分词器 | |
74 | | -| 向量检索 | ✗ | 基于语义相似度,不使用分词 | |
| 73 | + | 检索模式 | 是否生效 | 说明 | |
| 74 | + |---------|---------|------| |
| 75 | + | 全文检索 | ✓ | 基于关键词匹配,使用分词器 | |
| 76 | + | 混合检索 | ✓ | 全文检索部分使用分词器 | |
| 77 | + | 向量检索 | ✗ | 基于语义相似度,不使用分词 | |
75 | 78 |
|
0 commit comments