《大容量智能信息检索系统剖析.docx》由会员分享,可在线阅读,更多相关《大容量智能信息检索系统剖析.docx(1页珍藏版)》请在三一文库上搜索。
大容量智能信息检索系统南宁市平方软件新技术有限责任公司开发的“大容量智能信息检索系统” , 2009 年 2 月 19 日通过了市科技局主持的科技成果鉴定。该系统采用 KNN 算法,实现了大容量文档信息的智能检索,支持对多种常用文档格式及数据库文本进行全文检索、主题检索和分类浏览。系统把全文检索和向量空间检索相结合,实现了高效率的主题检索。系统索引的空间膨胀比为 1 : 0.58 ,速度为3.8MB/m , 2G 数据量的检索速度平均为 414 毫秒 /次。系统采用高效文本自动分类技术,提供分类浏览功能,获得较好的分类效果,平均查全率为91,平均查准率为93 。系统已在广西柳工机械技术研究院、北海政务网、广西人事考试网和南宁政务网应用,获得了较好的效益。该系统在整合全文检索和文本自动分类、实现本地大容量数据检索方面处于国内领先水平。(罗海鹏)