×

北风网 Lucene从基础到实战高级(实现华电内部搜索项目)

标签: 华电项目信息
第1讲-信息检索和全文检索介绍

第2讲-Lucene介绍基本使用

第3讲-Lucene建立索引过程深度剖析

第4讲-Lucene搜索1

第5讲-Lucene搜索2

第6讲-Lucene高级应用排序.过滤.高亮.分页详解1

第7讲-Lucene高级应用排序.过滤.高亮.分页详解2

第8讲-Lucene高级应用排序.过滤.高亮.分页详解3

第9讲-Compass介绍和使用1

第10讲-Compass介绍和使用2

第11讲-Compass应用实战站内检索

第12讲-Compass应用实战多条件分页搜索1

第13讲-Compass应用实战多条件分页搜索2

第14讲-使用compass的GPS功能自动建立增量索引

-------------------------------------------------------------------------------------------------------------------------------------------------------------

      北风网特邀讲师刘老师,为某培训机构一线讲师,其从事讲师教学多年!本课程由是从刘老师曾经开发的项目中提取出来的,具有很强的教育意义,项目中集合Lucene,struts2.0,spring,ibaits同时在项目开发过程中,将就ibaits进行一个细致的讲解,完全不需要ibaits基础即可进行学习,课程安排将涉及很多知识点,并将这些知识和案例综合应用于项目,达到事半功倍的效果!

    课程特色:理论结合实践!每讲前部分先将理论,然后用代码去完全理论的实践。

Lucene课程大纲:

1. Lucene概述

1.1 课程概述

1.2 认识Lucene

1.3 Lucene的经典应用

1.4 Lucene基本开发环境配置

2. Lucene系统架构

2.1 Lucene的特点

2.2 核心包及其功能介绍

2.3 Lucene核心索引类介绍

2.4 Lucene核心搜索类介绍

2.5 Lucene与关系数据库

2.6 Lucene内部实现原理

3. 索引

3.1 为什么要用索引

3.2 Lucene索引的优越性

3.3 Lucene索引建立

3.4 利用Lucene组件建立索引

3.5 删除Document

3.6 恢复删除

3.7 Document更新操作

3.8 使用RamDirectory

3.9 Document的Boost设置

3.10 索引优化

4. 搜索

4.1 简单搜索的实现

4.1.1 指定字段的搜索

4.1.2 ScoreDoc的运用

4.2 Query类的使用

4.2.1 搜索中使用TermQuery

4.2.2 搜索中使用RangeQuery

4.2.3 搜索中使用PreFixQuery

4.2.4 搜索中使用FuzzyQuery

4.2.5 搜索中使用WilcardQuery

4.2.6 搜索中使用BooleanQuery

4.4分页搜索的实现

4.3 QueryParser类的使用

4.3.1 默认的字段中检索

4.3.2 搜索中运用逻辑运算

4.3.3 前缀搜索和模糊搜索

4.3搜索的总结

5 分词

5.1 分词的基本原理

5.2 Lucene分词器的使用

5.3 中文分词

5.3.1 中文分词的基本原理

5.3.2 优秀中文分词器介绍

5.3.3在搜索中使用中文分词器

6. 解析文档

6.1 XML文件的索引

6.1.1 了解XPath

6.1.2 XML解析

6.2 PDF文档的索引

6.1 使用PDFBox处理PDF文档 

6.2 使用xpdf来处理中文PDF文档 

6.3 HTML文档索引

6.3.1 获取HTML源文档

6.3.2 使用JTidy

6.3.2 使用NekoHTML

6.3.3 使用HttpClient

6.3.4 使用HTMLParser

6.4 Word文档的索引

6.4.1 POI对Word的处理类 

6.4.2 使用Jacob来处理Word文档 

7. 高亮

7.1 高亮的基本原理

7.2 在搜索中使用高亮

8. 网络爬虫Heritrix 

8.1 Heritrix使用入门 

8.2 Heritrix的架构 

8.3 Heritrix的应用 

9项目实战-华电企业内部文档搜索系统(项目截图稍后公布)

9.1 需求说明

9.2 系统架构介绍

9.2.1 技术方案的选择

9.2.2 使用Ibatis

9.3 系统模块分析

9.4 系统开发

项目涉及技术点和内容:

知识范围:

全文检索,倒排索引,中文分词,爬虫,文档解析,ibatis等

技术选型:

Lucene+Struts2+Spring+IBatis

项目价值:

本项目是企业级的搜索系统,既可以自成体系,拿出来作为一个单独的系统里来使用;也可以集成到其他现有的系统中,成为其他系统的一个重要的模块(现在很多网站内部都集成了一个全文检索系统,很多OA系统都有一个全文检索系统)。





下载地址

本帖隐藏的内容





链接: http://pan.baidu.com/s/1yByO2 密码: 0qgx

解压密码:www.hegouvip.com
爱不单行

写了 6 篇文章,拥有财富 20,被 0 人关注

您需要登录后才可以回帖 登录 | 网赚注册
B Color Link Quote Code Smilies

成为第一个吐槽的人

联系QQ:1150388920|长沙钢琴培训|网站地图|创富吧网赚论坛 |湘ICP备18012331号
Powered by 创富吧   © 2001-2019 Comsenz Inc.
返回顶部