例题:(信息检索导论-修订版 习题12-7)
假定某文档集有如下4篇文档组成
为该文档集建立一个查询似然模型。假定采用文档语言模型和文档集语言模型的混合模型,权重均为0.5.采用MLE来估计两个一元模型。
计算在查询click、shears以及click shears下每篇文档模型对应的概率,并利用这些概率来对返回的文档排序。将这些概率填在下表中。
对于查询click shears来说,最后得到的文档次序是?
![](https://img-blog.csdnimg.cn/52c49143f9c44adcbad48037f29c56dd.png)
答案
1、 查询似然模型:
![](https://img-blog.csdnimg.cn/f004f62739404e05a6f5ec49c7c51a63.png)
2、 计算在查询click、shears以及click shears下每篇文档模型对应的概率,并利用这些概率来对返回的文档排序。将这些概率填在下表中.
![](https://img-blog.csdnimg.cn/e3af5f06e4fc4d0c87492dfe0303cee4.png)
3、 查询click shears 的文档排序为:Doc1、Doc4、Doc2、Doc3