广告位不存在!
详情 声明
商品详情
资源名称:Lucene搜索引擎开发进阶实战
内容简介:【编辑推荐】从实用的角度出发,理论与实战相结合,配以大量的案例,深入探讨Lucene搜索引擎开发的实现方法和技巧收录网上与搜索引擎开发相关的各类问题和误区,并给出解决办法,指导读者在实战中提升技能【内容简介】《Lucene搜索引擎开发进阶实战》结合笔者的实际开发经验,总结了一些新的开发技巧和开发思路,并对网上流传的一些错误技术点和代码进行验证,同时给出正确的思路,旨在给开发者提供一本清晰、完整、易懂的指导手册。本书既可为零起点的Lucene初学者提供系统全面的学习指导,也可帮助有相关经验的开发者解决在开发过程中遇到的一些难题和疑惑。《Lucene搜索引擎开发进阶实战》共12章,分为四部分,第一部分首先介绍网络爬虫和Web搜索,然后讲述Lucene的概念和架构;第二部分通过一个小实例,并结合为文本创建索引来讲解其中的一些方法和类;第三部分主要基于数据库搜索创建搜索引擎实例,阐述技术疑难问题,讨论如何建立工程类的索引,如何使用分词技术等,并对创建索引过程中的jar包进行解析,然后介绍搜索引擎开发中关键的查询方法和高亮显示技术,以及查询结果排序和词频统计的相关知识,最后概述性能优化(包括代码优化、索引优化以及备份和恢复)等相关知识;第四部分总结目前的一些技术,并对未来的一些技术发展进行展望。
资源目录:第1章 网络爬虫策略 11.1 信息时代的飞跃 11.1.1 搜索引擎的出现 11.1.2 搜索之网络爬虫的由来 41.2 网络爬虫 61.2.1 网络爬虫的基础框架 61.2.2 网络爬虫的策略分析 81.2.3 暗网获取 111.2.4 分布式爬虫 121.3 实现Web搜索 131.3.1 Web搜索的概念 131.3.2 经典小实例展示 131.4 疑难解析 181.4.1 本节技术概念 181.4.2 实例疑难解析 191.5 实践心得 191.5.1 如何快速实现Web搜索 191.5.2 如何解决和发现代码错误 201.6 本章小结 21第2章 搜索引擎技术中的Lucene 222.1 Lucene到底是什么 222.1.1 Lucene的由来 222.1.2 Lucene的概念 232.1.3 Lucene的适用范围 232.2 Lucene的架构 242.2.1 Lucene=“完整的搜索程序”吗 262.2.2 搜索和索引组件介绍 272.2.3 其他模块 282.2.4 Lucene与应用的完美结合 292.3 Lucene小程序 292.3.1 创建索引 292.3.2 搜索索引 342.4 实践心得 352.4.1 实现创建和搜索的技术解析 362.4.2 实例创建过程中的个人心得 362.5 本章小结 36第3章 创建索引实例 373.1 开发前的软硬件准备 373.1.1 开发语言和专业基础 373.1.2 开发环境基础 383.2 对文本文档进行索引 413.2.1 新建文本文档 413.2.2 基础的索引代码 433.2.3 索引结果 433.3 实例中用到的类和关键词 443.3.1 实例中涉及的类 443.3.2 实例中涉及的关键词 463.4 本章技术要点和关键点 513.4.1 本章技术要点 513.4.2 本章关键点 523.4.3 技术突破点 523.5 开发中的个人心得分享 533.6 本章小结 53第4章 初建索引 544.1 建立数据库索引的前提和意义 544.1.1 建立数据库索引的前提 544.1.2 建立数据库索引的基本条件 554.1.3 建立数据库索引的意义 574.2 建立数据库索引实例 584.2.1 新建索引类 584.2.2 实例核心代码示例 664.3 实例中重要的工具:Luke 704.3.1 什么是Luke 704.3.2 Luke的作用 704.4 解决疑难问题的个人心得 714.4.1 多样化实例的参考 724.4.2 案例分析 744.5 SQL Server 2005、SQL Server 2008以及Oracle数据库的区别 754.6 本章小结 76第5章 分词技术详解 775.1 分词的定义和意义 775.2 英文分词介绍 785.3 中文分词解析 805.3.1 中文分词的目的 805.3.2 中文分词的意义 805.3.3 中文分词的方法 825.4 实例的分词方法剖析 865.4.1 IKAnalyzer的诞生 865.4.2 IKAnalyzer的配置方法 865.4.3 IKAnalyzer的使用 885.5 分词技术的广泛应用 895.5.1 搜索引擎网站的分词技术应用 905.5.2 分词技术深入各个领域 915.6 实践见解 925.6.1 关于分词的问题 925.6.2 关于搜索引擎分词和查找的个人心得 935.7 本章小结 94第6章 jar包应用详解 956.1 jar包的定义 956.2 基本的jar包介绍 966.2.1 连接SQL Server的jar包 976.2.2 Lucene常用的jar包 986.3 实例中的分词jar包IKAnalyzer3.2.8 986.3.1 概念 986.3.2 适用范围和基本配置要求 996.3.3 使用案例分析 1006.4 实例中的其他jar包应用 1026.4.1 实例包含的其他jar包 1026.4.2 适用范围和案例分析 1036.5 jar包的调用方法 1036.6 扩展:如何生成jar包和运行jar包 1046.7 实践分享 1066.7.1 如何在自己的项目中灵活运用jar包 1066.7.2 jar的路径问题 1076.7.3 jar包中class文件的反编译 1086.8 本章小结 109第7章 构建应用程序的实现 1107.1 建立实例的项目 1107.1.1 src目录 1107.1.2 webroot目录 1167.2 详解扩展词典和停止词 1217.2.1 为什么需要扩展词典和停止词 1217.2.2 扩展词典的应用 1227.2.3 停止词应用 1227.3 应用程序测试 1247.3.1 应用程序在MyEclipse下的调试 1247.3.2 搜索结果的分页技术 1257.3.3 实现界面搜索 1297.4 开发过程中的疑难问题分享 1297.4.1 停止词的准确应用 1307.4.2 扩展词典问题 1307.4.3 界面分页显示的实例分析 1317.4.4 localhost与127.0.0.1的异同 1317.4.5 src目录和webroot目录 1327.5 本章小结 132第8章 查询方法的实现 1338.1 查询的概念和意义 1338.1.1 搜索引擎实现查询的概念 1338.1.2 搜索引擎查询的意义 1368.2 查询的分类 1368.2.1 完全匹配查询 1368.2.2 模糊查询 1378.2.3 多域查询 1388.2.4 通配符查询 1408.2.5 其他查询 1408.2.6 组合查询 1428.3 实例分析 1428.3.1 完全匹配查询实例解析 1428.3.2 模糊查询实例分析 1438.3.3 多域查询实例分析 1448.3.4 通配符查询实例分析 1458.3.5 其他查询实例及分析 1468.3.6 组合查询实例及分析 1468.4 实践过程中的重难点解析 1488.4.1 使用什么查询方法 1488.4.2 模糊查询案例剖析 1498.4.3 Occur.MUST与Occur.SHOULD 1508.5 本章小结 150第9章 高亮显示技术 1519.1 高亮显示的概念和目的 1519.1.1 高亮显示的概念 1519.1.2 高亮显示的目的 1529.2 高亮显示的模块介绍 1529.2.1 高亮显示的步骤 1529.2.2 高亮显示的重要模块 1549.2.3 其他相关内容 1559.3 高亮实现搜索结果 1569.3.1 高亮显示的实例 1569.3.2 高亮显示的搜索结果 1599.3.3 高亮显示界面效果 1619.4 高亮显示的应用 1629.5 高亮显示的技术疑难分析 1639.5.1 如何解决高亮查询结果显示不完全的问题 1639.5.2 高亮显示的对应问题解析 1649.6 本章小结 165第10章 结果排序和词频统计 16610.1 排序和词频统计概念 16610.1.1 什么是搜索结果排序 16610.1.2 搜索结果排序的意义 16710.1.3 什么是词频统计 16810.1.4 词频统计的意义何在 16810.2 排序分类 16910.2.1 根据域值排序 16910.2.2 索引顺序排序 17010.2.3 根据相关性排序 17010.2.4 根据词频率排序 17110.2.5 其他 17210.3 实例分析 17210.3.1 根据域值排序的实例解析 17210.3.2 根据索引顺序排序的实例分析 17310.3.3 根据相关性排序的实例分析 17310.3.4 根据词频排序实例分析 17510.3.5 其他排序方法实例分析 17710.4 实践心得 17810.4.1 查询结果排序的问题 17810.4.2 关于词性处理的问题解析 18110.5 本章小结 183第11章 开发中的性能优化概述 18411.1 代码的优化 18411.1.1 什么是代码优化 18411.1.2 代码优化的意义 18511.1.3 如何实现代码的优化 18511.2 索引优化 18911.2.1 索引优化的目的 18911.2.2 索引优化的方法和途径 18911.2.3 索引优化的效果 19211.3 索引的备份和错误修复 19211.3.1 如何实现索引备份 19311.3.2 恢复索引的实现 19311.3.3 修复索引 19411.4 本章小结 195第12章 对瓶颈技术的未来设想 19612.1 海量数据库资源搜索 19612.1.1 什么是海量数据库 19612.1.2 海量数据库资源搜索的现状和瓶颈 19712.1.3 海量数据库搜索的未来设想 19712.2 高亮显示查询结果的未来设想 19912.2.1 高亮显示出现的意义 19912.2.2 高亮显示目前现状 19912.2.3 黄褪技术概述 20012.2.4 对高亮显示查询结果的未来展望 20012.3 搜索引擎开发的规范性约束 20112.3.1 搜索引擎开发的现状 20112.3.2 版本的控制 20212.3.3 未来国际规范性约束的展望 20212.4 本章小结 202附录A Java安装详解 203附录B SQL Server 2005安装详解 207附录C MyEclipse 安装详解 213附录D Lukeall在本书中的应用 215附录E MyEclipse快捷键详解 218
资源截图:1.png
声明

1、链接失效请联系客服人员。
2、购买后如果链接失效可联系客服人员完善资源或进行退款办理。
3、资源均来源于网友分享及网络公开发表文件,所有资料仅供学习交流。
4、所收取费用仅用来维系网站运营,性质为用户友情赞助,并非售卖文件费用。
5、如侵犯您的权益,请联系客服人员,我们将会在第一时间进行处理。

相关推荐