农业搜索引擎倒排索引缓冲机制研究

农业搜索引擎倒排索引缓冲机制研究

薛煜阳;张太红;张晓明;冯向萍;陈燕红;白涛;马健

【期刊名称】《新疆农业大学学报》

【年(),期】2011(034)002

【摘要】为了解决ASPSeek倒排索引直接采用操作系统文件缓冲访问机制带来的效率问题,本研究以125万张中文农业网页为样本,采用块大小可变的倒排索引存储结构,设计了基于LRUMRULFUMFUClockRandomFPA替代策略的专用缓冲管理机制.对这7种替代策略的缓冲命中率及查询访问时间对比测试表明,当所有词条以相同的概率进行检索时,Clock算法为较好的缓冲替代策略,当词条以特定差别概率进行检索时,本研究提出的FPA算法为较好的缓冲替代策略.%In order to solve the efficiency problem of ASPSeek inverted index caused by directly using operation system file buffer query mechanism,taken 1. 25 million Chinese agricultural web pages as sample, this paper proposed a new blocking inverted index scheme with buffer mechanism based on LRU, MRU, LFU,MFU,Clock.Random and FPA replacement strategies. The contrast test of buffer hit rate and query access time of these seven replacement strategies,indicated that clock strategy was better than others when all Chinese terms were retrieved with equal probability and the new proposed FPA strategy was better than others when all Chinese terms were retrieved with specifically different probability.

【总页数】4(161-164)

【关键词】农业搜索引擎;倒排索引;缓冲替换策略

【作者】薛煜阳;张太红;张晓明;冯向萍;陈燕红;白涛;马健

【作者单位】新疆农业大学计算机与信息工程学院,乌鲁木齐830052;新疆农业大学计算机与信息工程学院,乌鲁木齐830052;中国农业大学信息与电气工程学院,北京100083;新疆维吾尔自治区招生办公室,乌鲁木齐830052;新疆农业大学计算机与信息工程学院,乌鲁木齐830052;新疆农业大学计算机与信息工程学院,乌鲁木齐830052;新疆农业大学计算机与信息工程学院,乌鲁木齐830052;新疆农业大学计算机与信息工程学院,乌鲁木齐830052

【正文语种】中文

【中图分类】TP393.4

【文献来源】

https://www.zhangqiaokeyan.com/academic-journal-cn_journal-xinjiang-agricultural-university_thesis/020*********.html

【相关文献】

1.学科门户智能搜索引擎的设计与构建——农业史门户搜索引擎的实验 [J], 刘竟; 侯汉清

2.国外网络搜索引擎最佳资源现状述评(1)——桌面搜索工具、搜索引擎指南、目录和论著资源述评 [J], 赵金海

3.搜索引擎社会化,人与信息相结合——云云网携手戴尔,建设中国第一个社会化搜索引擎,让用户搜索满意度提升30 [J],

4.搜索引擎检索中的问题与新一代搜索引擎展望 [J], 陈俊嵋

5.综合搜索引擎和垂直搜索引擎的比较分析 [J], 严安

以上内容为文献基本信息,获取文献全文请下载

《农业搜索引擎倒排索引缓冲机制研究.doc》
将本文的Word文档下载,方便收藏和打印
推荐:
下载文档
热门推荐
相关推荐