我们对中文查询的召回率出乎意料地高。我成功地使用仅具有 2 个属性的简单数据模型重现了最小用例。
复制
-
使用zh-Hans.microsoft分析器为中文产品描述定义属性DescriptionZhCn
-
在 DescriptionZhCn 中使用以下值填充两条记录
Contoso减振接杆
Contoso 缩径接柄
-
使用选项 searchMode=all、queryType=full、searchFields=DescriptionZhCn、api-version=2019-05-06 进行搜索,并在搜索参数中包含以下值:
减振接杆
缩径接柄
EXPECTED
当搜索减振接杆时,我希望只包含描述为“Contoso 减振接杆”的记录。当搜索缩径接柄时,我只期望记录“Contoso 缩径接柄”。
ACTUAL
搜索减振接杆或缩径接杆意外返回两条记录。唯一共同的字是第三个字“接”。
我已经验证了 zh-Hans.microsoft 分析器的输出,它将两个中文字符串拆分为 4 个标记。例如。
减振接杆 => 减 振 接 杆
我的查询仅匹配其中一个标记。我正在使用 searchMode=all。为什么我的查询匹配?这是一个错误吗?任意输入Yanoosh, Liam?
None
本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系:hwhale#tublm.com(使用前将#替换为@)