第1章 概论
1.1 信息检索的概念
1.2 信息检索与数据库检索
1.3 信息检索模型
1.3.1 内容型检索模型
1.3.2 全文检索模型
1.4 多媒体信息检索
1.4.1 基于内容的检索特点
1.4.2 多媒体特征
1.4.3 多媒体内容描述标准MPEG一7
1.4.4 多媒体信息检索
1.5 信息检索技术应用举例
1.5.1 Web信息检索工具
1.5.2 市场营销工具
1.5.3 数字图书馆
1.6 信息检索相关技术
1.6.1 信息过滤
1.6.2 文本自动分类
1.6.3 交叉语言信息检索
1.6.4 信息抽取
1.7 信息检索的发展
1.8 本书内容导读
习题
第2章 信息检索系统性能评价
2.1 信息检索系统的有效性
2.2 性能评价指标
2.2.1 查全率和查准率
2.2.2 查全率一查准率曲线与平均查准率
2.2.3 R查准率
2.2.4 F调和均值
2.2.5 E均值
2.2.6 Ranking指标
2.3 web检索系统性能评价
2.4 信息检索领域的相关组织和会议
习题
第3章 索引项提取与加权
3.1 索引项提取
3.1.1 索引项
3.1.2 索引单位
3.1.3 停用词的去除
3.1.4 词干提取
3.2 索引项加权
3.2.1 局部权重
3.2.2 全局权重
3.2.3 文本规范化
3.3 单词分布模型
3.3.1 二项分布与泊松分布
3.3.2 RIDF
3.4 基于KeyGraph的索引项提取
3.4.1 基础概念的构成
3.4.2 意图的提取
习题
第4章 基于向量空间模型的检索
4.1 线性代数基础
4.1.1 向量
4.1.2 矩阵
4.1.3 向量空间
4.2 基于向量空间模型的检索
4.3 文本检索中的相关反馈
4.4 潜在语义索引
4.4.1 主成分分析
4.4.2 奇异值分解
4.4.3 基于潜在语义索引的检索
4.5 高维稀疏矩阵
4.5.1 高维稀疏矩阵的压缩
4.5.2 高维稀疏矩阵的特征值问题
第5章 全文检索——字符串匹配技术
5.1 字符串匹配问题概述
5.2 简单字符串匹配算法
5.2.1 simpleSearch的字符串匹配过程
5.2.2 SimpleSeareh算法
5.2.3 算法分析
5.3 Knuth-Morris-Pratt算法
5.3.1 KMP字符串匹配过程
5.3.2 KMP算法
5.3.3 next函数计算
5.3.4 next函数
5.3.5 KMP算法效率
5.4 Boyer-Moore算法
5.4.1 BM算法字符串匹配过程
5.4.2 BM算法
5.4.3 skip函数
5.4.4 BM算法效率
5.5 Aho-Corasick算法
5.5.1 AC机
5.5.2 AC字符串匹配过程
5.5.3 AC算法
5.5.4 AC算法效率
5.5.5 AC机构成方法
5.6 AC机的动态构成
5.6.1 关键字的增加
5.6.2 增加关键字的算法
5.6.3 关键字的删除
5.6.4 关键字删除算法
习题
第6章 全文检索——索引技术
6.1 签名文件
6.1.1 签名文件的构成方法
6.1.2 签名文件检索
6.1.3 多查询词检索
6.1.4 分块管理的签名文件
6.1.5 签名文件评价
6.2 倒排文件
6.2.1 倒排文件的构成
6.2.2 倒排文件检索
6.2.3 采用N元组索引的倒排文件
6.2.4 文本号向量的压缩方法
6.2.5 倒排文件评价
6.3 采用PatriciaTrie的全文检索
6.3.1 PatriciaTrie
6.3.2 PatliciaTrie检索方法
6.3.3 PatriciaTrie的长处与不足
6.4 PatriciaTrie的压缩
6.4.1 PAT数组
6.4.2 PaCB树压缩方法
6.4.3 PaCB树检索方法
6.4.4 PaCB树的效率评价
习题
第7章 图像检索技术
7.1 图像检索技术概述
7.1.1 图像检索方式
7.1.2 图像检索系统概念结构
7.1.3 图像的多级描述模型
7.1.4 典型图像检索系统
7.2 图像特征抽取
7.2.1 颜色空间
7.2.2 颜色特征
7.2.3 纹理特征
7.2.4 形状特征
7.2.5 空间关系特征
7.3 相似性度量
7.4 图像检索中的相关反馈技术
7.4.1 图像多级特征的相关反馈
7.4.2 图像特征规范化
7.4.3 特征权重的调整
7.5 综合特征检索
7.5.1 不同特征的特点
7.5.2 特征的综合使用