• 信息检索涉及对文档、网页、联机目录、结构化和半结构化记录及多媒体对象等信息项的表示、存储、组织和访问。信息项的表示和组织必须便于用户访问他们感兴趣的信息。

  • 信息检索发展的关键阶段:书籍->图书馆->索引->计算机->排序技术和搜索引擎等现代研究内容

  • 信息检索系统的主要目标是检出所有和用户查询相关的文档,并且把检出的不相关文档控制在最低限度。相关性的概念对信息检索至关重要。对相关性的评估没有固定标准,不存在能在任何时间给任何用户提供完美答案的检索系统。

  • 检索任务可分为浏览和搜索,浏览是探索式检索,目标不太明确,搜索则相反。

  • 信息检索系统的高层软件架构:

  • 文档的索引、检索和排序过程:

  • Web流行的根源:出版自由。

  • Web对搜索的影响:网页爬取新技术,海量文档集和海量查询流量,相关性预测更复杂,从文字搜索转向结构化数据搜索,垃圾信息泛滥。