当前位置:首页 > 图书资源 > 时时后二号码信息检索:实现和评价搜索引擎

时时后二号码信息检索:实现和评价搜索引擎


更新时间:2018-10-16 16:27:25

这款【时时后二号码信息检索:实现和评价搜索引擎】资源经过9盘网盘审核之后发布,推荐您使用百度云或者迅雷下载。如果迅雷无法自动调用下载,请使用(右键该地址-复制链接-新建下载)的方式下载。发布时间:2018-10-16 16:27:25

资源简介

时时后二号码信息检索:实现和评价搜索引擎

基本信息
原书名:Information Retrieval: Implementing and Evaluating Search Engines
原出版社: The MIT Press
作者: (美)Stefan Büttcher (加)Charles L.A.Clarke (加)Gordon V.Cormack
译者: 陈健 黄晋
丛书名: 计算机科学丛书
出版社:机械工业出版社
ISBN:9787111359906
上架时间:2011-12-31
出版日期:2012 年1月
开本:16开
页码:412
版次:1-1
所属分类:计算机 > 信息系统 > 综合
教材
编辑推荐
 
信息检索奠定了现代搜索引擎的基石
内容涵盖范围广与模块化方式构架相得益彰
是信息管理系统专业人员必不可少的参考书!
内容简介
书籍
计算机书籍
《信息检索:实现和评价搜索引擎》从多个视角对信息检索技术进行了深入讲解,内容涵盖了信息检索系统的架构、基础技术、词条和词项、静态和动态倒排索引、查询处理、索引压缩技术、概率模型、语言模型、分类和过滤、融合和元学习、评价方法以及并行信息检索、Web检索和XML检索等具体应用。《信息检索:实现和评价搜索引擎》以模块化的方式进行组织,理论性强,体系完整,同时强调实践。作者以认真严谨的态度实现了书中绝大部分的主要方法,并详尽地描述了各种方法的适用环境以及取得的效果。
《信息检索:实现和评价搜索引擎》可作为高等院校信息管理与信息系统、计算机科学与技术、情报学、图书馆学以及电子商务等专业的高年级本科生和研究生的教材和参考书,对于从事信息检索与网络分析等实际工作的从业人员也具有较高的参考价值。

 

作译者

作者:(美国)布切尔 (Stefan Buttcher) (加拿大)Charles L.A.Calrke (加拿大)Gordon V.Cormack 译者:陈健 黄晋 等
布切尔(Stefan Buttcher)是Google公司资深网站可靠性工程师。Charles L A.Clarke和Gordon V Cormack是滑铁卢大学David R.Cheriton计算机科学学院的计算机科学教授。 

目录

出版者的话
译者序

前言
符号
第一部分 基础知识
第1章 绪论
1.1 什么是信息检索
1.1.1 web搜索
1.1.2 其他搜索应用
1.1.3 其他信息检索应用
1.2 信息检索系统
1.2.1 信息检索系统基础架构
1.2.2 文档及其更新
1.2.3 性能评价
1.3 使用电子文本
1.3.1 文本格式
1.3.2 英文文本中的分词
1.3.3 词项分布
1.3.4 语言模型
1.4 测试集
1.5 开源信息检索系统
1.5.1 lucene
1.5.2 indri
1.5.3 wumpus
1.6 延伸阅读
1.7 练习
1.8 参考文献
第2章 基础技术
2.1 倒排索引
2.1.1 延伸例子:词组查找
2.1.2 实现倒排索引
2.1.3 文档和其他元素
2.2 检索与排名
2.2.1 向量空间模型
2.2.2 邻近度排名
2.2.3 布尔检索
2.3 评价
2.3.1 查全率和查准率
2.3.2 排名检索的有效性指标
2.3.3 创建测试集
2.3.4 效率指标
2.4 总结
2.5 延伸阅读
2.6 练习
2.7 参考文献
第3章 词条与词项
3.1 英语
3.1.1 标点与大写
3.1.2 词干提取
3.1.3 停词
3.2 字符
3.3 字符n-gram
3.4 欧洲语言
3.5 cjk语言
3.6 延伸阅读
3.7 练习
3.8 参考文献
第二部分 索引
第4章 静态倒排索引
4.1 索引的组成部分和索引的生命周期
4.2 词典
4.3 位置信息列表
4.4 交错词典和位置信息列表
4.5 索引的构建
4.5.1 基于内存的索引构建法
4.5.2 基于排序的索引构建法
4.5.3 基于合并的索引构建法
4.6 其他索引
4.7 总结
4.8 延伸阅读
4.9 练习
4.10 参考文献
第5章 查询处理
5.1 排名检索的查询处理
5.1.1 document-at-a-time查询处理
5.1.2 term-at-a-time查询处理
5.1.3 预计算得分贡献
5.1.4 影响力排序
5.1.5 静态索引裁剪
5.2 轻量级结构
5.2.1 广义索引表
5.2.2 操作符
5.2.3 例子
5.2.4 实现
5.3 延伸阅读
5.4 练习
5.5 参考文献
第6章 索引压缩
6.1 通用数据压缩
6.2 符号数据压缩
6.2.1 建模和编码
6.2.2 哈夫曼编码
6.2.3 算术编码
6.2.4 基于符号的文本压缩
6.3 压缩位置信息列表
6.3.1 无参数间距压缩
6.3.2 参数间距压缩
6.3.3 上下文感知的压缩方法
6.3.4 高查询性能的索引压缩
6.3.5 压缩效果
6.3.6 解码性能
6.3.7 文档重排
6.4 压缩词典
6.5 总结
6.6 延伸阅读
6.7 练习
6.8 参考文献
第7章 动态倒排索引
7.1 批量更新
7.2 增量式索引更新
7.2.1 连续倒排列表
7.2.2 非连续倒排列表
7.3 文档删除
7.3.1 无效列表
7.3.2 垃圾回收
7.4 文档修改
7.5 讨论及延伸阅读
7.6 练习
7.7 参考文献
第三部分 检索和排名
第8章 概率检索
8.1 相关性建模
8.2 二元独立模型
8.3 Robertson/Sparckjones权重公式
8.4 词频
8.4.1 Bookstein的双泊松模型
8.4.2 双泊松模型的近似
8.4.3 查询词频
8.5 文档长度:BM25
8.6 相关反馈
8.6.1 词项选择
8.6.2 伪相关反馈
8.7 区域权重:BM25F
8.8 实验对比
8.9 延伸阅读
8.10 练习
8.11 参考文献
第9章 语言模型及其相关方法
9.1 从文档中产生查询
9.2 语言模型和平滑
9.3 使用语言模型排名
9.4 Kullback-Leibler距离
9.5 随机差异性
9.5.1 一个随机模型
9.5.2 精华性
9.5.3 文档长度规范化
……
第10章 分类和过滤
第11章 融合和元学习
第四部分 评价
第12章 度量有效性
第13章 度量效率
第五部分 应用和扩展
第14章 并行信息检索
第15章 web搜索
第16章 xml检索
第六部分 附录
附录a 计算机性能 

下载地址列表

下载地址1

发表评论 共有0条评论