Lucene

Lucene是apache软件基金会4 jakarta项目组的一个子项目,是一个开放源代码的全文检索引擎工具包,即它不是一个完整的全文检索引擎,而是一个全文检索引擎的架构,提供了完整的查询引擎和索引引擎,部分文本分析引擎(英文与德文两种西方语言)。

Lucene.Net 2.3.1开发介绍 —— 三、索引(三)

3、Field配置所产生的效果  索引数据,简单的代码,只要两个方法就搞定了,而在索引过程中用到的一些类里最简单,作用也不小的就是Field,接下来看看Field的各项设置都会有什么样的效果。 代码 3.1   Code 1/**//// <summary> 2/// 索引数

2015-07-08 16:56:05

Lucene.Net 2.3.1开发介绍 —— 四、搜索(一)

既然是内容筛选,或者说是搜索引擎,有索引,必然要有搜索。搜索虽然与索引有关,那也只是与索引后的文件有关,和索引的程序是无关的,因此,搜索和索引一般是分开部署。简单地说,就是一个应用程序(桌面程序)来索引,一个WEB程序来实现搜索。当然,为了测试的时候简单,这里还是使用NUnit的方式运行。搜索讲完后,将会简单介绍单机搜索引擎如何部署。 4.1 搜索与什么有

2015-07-08 16:56:05

Lucene学习总结之七:Lucene搜索过程解析(3)

2.3、QueryParser解析查询语句生成查询对象 代码为: QueryParser parser = new QueryParser(Version.LUCENE_CURRENT, \"contents\", new StandardAnalyzer(Version.LUCENE_CURRENT)); Query query =

2015-07-08 16:56:04

新手也玩—Lucene.Net

今天工作不是特别多,在逛园子的时候看到了Lucene.Net,所以自己也参照别人的博文自己动手写了个DEMO(虽然很多是参考过来的,不过自己动手更容易记住嘛!)。废话不多说,先上个图,把以前看到的几个好的jquery插件也用上去了(JQuery关键字高亮度、JQuery分页),不记得地址了,就没有留作者的网址。 第一步,下载DLL文件,我这里用的是2.

2015-07-08 16:56:04

Lucene学习总结之十:Lucene的分词器Analyzer

1、抽象类Analyzer 其主要包含两个接口,用于生成TokenStream: TokenStream tokenStream(String fieldName, Reader reader); TokenStream reusableTokenStream(String fieldName, Reader reader) ; 所谓TokenStre

2015-07-08 16:56:04

Lucene 源代码剖析-12 如何给文档评分

转载自 http://download.csdn.net/source/858994 源地址下是 Word 文档,这里转换成HTML 格式                如何给文档评分   &nbsp

2015-07-08 16:56:03

Lucene+nutch构建垂直搜索引擎

      垂直搜索是针对某一个行业的专业搜索引擎,是搜索引擎的细分和延伸,是对网页库中的某类专门的信息进行一次整合,定向分字段抽取出需要的数据进行处理后再以某种形式返回给用户。垂直搜索引擎和普通的网页搜索引擎的最大区别是对网页信息进行了结构化信息抽取,也就是将网页的非结构化数据抽取成特定的结构化信息数据,好

2015-07-08 16:56:02

Pangu分词Lucene.Net搜索使用说明

首先对Lucene做一个简短的介绍: Lucene不是一个完整的全文检索应用,而是一个用java写的全文索引引擎工具包,它可以方便的嵌入到各种应用中实现针对应用的全文索引/检索功能。 Lucene的作者Doug Cutting是一位资深全文索引/检索专家,曾经是V-Twin搜索引擎(Apple的Copland操作系统的成就之一)的主要开发者,后在Exci

2015-07-08 16:56:02

Lucene.Net:使用eaglet的盘古分词进行分词和搜索

本文主要简单介绍如何使用eaglet的盘古分词在lucene.net中进行创建索引和简单搜索。盘古分词是eaglet大大的杰作,如果您还没有尝试使用过,希望本文的介绍会对您有所帮助。 1、盘古分词参考资料汇总 http://www.cnblogs.com/eaglet/tag/%e5%88%86%e8%af%8d/ http://panguse

2015-07-08 16:56:02

AzureDirectory Library for Lucene.Net

Sql Azure不支持全文索引的,所以微软官方推荐的做法是基于lucene来做全文索引,而且也有一个基于Azure Storage的Lucene.Net开源组件,已经支持到了最新的lucene.net 3.0.3。可以在CodePlex上下载到最新代码“AzureDirectory Library for Lucene.Net”&n

2015-07-08 16:56:01

lucene检索

原文地址:http://user.qzone.qq.com/523906455/blog/1324284955 不管怎么说,搜索都是非常重要的技术,不仅仅是操作系统集成了,很多应用软件都有搜索的功能,论坛有专门用于在论坛搜索的,互联网就有诸如像百度、谷歌之类的搜索引擎,总而言之,只要数据量稍微大一点的

2015-07-08 16:56:01

Lucene.Net:关于索引的一些补充说明和总结

在前面的几篇关于lucene的文章中,我已经简要说明了如何利用lucene进行分词、索引和搜索。最近大部分时间耗在查资料上,看得比较多比较杂但是一贯的不够深入,还好多数都是不会影响编程实践的概念性的东西。有时候我自己也感觉到有心无力,太关注那些表面的繁文缛节性的东西有让人失掉好奇、激情和勤奋实践的风险,毕竟我个人需要专心专注的事情是解决问题而不是多知道几个概

2015-07-08 16:56:01

使用Lucene.Net实现全文检索

目录 一 Lucene.Net概述 二 分词 三 索引 四 搜索 五 实践中的问题   一 Lucene.Net概述   Lucene.Net是一个C#开发的开源全文索引库,其源码包括“核心”与“外围”两部分。外围部分实现辅助功能,而核心部分包括: Luc

2015-07-08 16:56:01

Lucene.net入门学习系列(2)

      Lucene.net入门学习系列(1)-分词   Lucene.net入门学习系列(2)-创建索引   Lucene.net入门学习系列(3)-全文检索      在使用Lucene.net进行全文检索之前,需要写入索引,然后对索引进行检索。下面我们来看看如何建立索引。   具体步骤如下:   

2015-07-08 16:56:00

lucene学习之helloworld(简单实例)

// 引子 What’s Lucene Lucene是一个信息检索的函数库(Library),利用它你可以为你的应用加上索引和搜索的功能. Lucene的使用者不需要深入了解有关全文检索的知识,仅仅学会使用库中的一个类,你就为你的应用实现全文检索的功能. 不过千万别以为Lucene是一个象google那样的搜索引擎,Lucen

2015-07-08 16:56:00

.net lucene 实战搜索(二)----- 基本之索引

  也许很多朋友没有luncene,但没关系,你可以认为他仅仅是“数据库”,或者文档库更合适。 这也是我们网站有又一次数据库服务器被不知道谁提掉网线,仍然运行了1天没人发现,-_-!. 既然luncene是文档库结构模型(不知道这样称呼是否合适),那我们先来了解luncene 一些基本的组成:  &nbsp

2015-07-08 16:56:00

Lucene sort 排序

排序是对于全文检索来言是一个必不可少的功能,在实际运用中,排序功能能在某些时候给我们带来很大的方便,比如在淘宝,京东等一些电商网站我们可能通过排序来快速找到价格最便宜的商品,或者通过排序来找到评论数最高或卖的最好的商品,再比如在Iteye里的博客栏里,每天都会以降序的方式,来显示出最新发出的几篇博客,有了排序,我们就能在某些时候很方便快速的得到

2015-07-08 16:55:59

Lucene.Net 2.3.1开发介绍 —— 三、索引(六)

2.2 Field的Boost 如果说Document的Boost是一条线,那么Field的Boost则是一个点。怎么理解这个点呢?设置Document的Boost会影响所有字段。在搜索的过程中,一般至少会搜索两个Field,比如同时搜索标题和内容。而Document的Boost将同时影响标题和内容的搜索得分,但是设置Field的Boost则不会有那么大的

2015-07-08 16:55:59

Lucene.net 实现全文搜索

忙了几天终于实现一个简单的全文搜索在此回顾总结一下本文介绍一下Lucene.Net 是什么?Lucene.Net 能作什么?以及怎么做的问题?最后给出 Lucene.Net 实现全文搜索的一个示例1、Lucene.Net 是什么?Lucene.net 起初是一个开源项目然后转向商业化,也在Lucen

2015-07-08 16:55:59

关于Lucene 3.0升级到Lucene 4.x 备忘

  最近,需要对项目进行lucene版本升级。而原来项目时基于lucene 3.0的,很古老的一个版本的了。在老版本中中,我们主要用了几个lucene的东西:   1、查询lucene多目录索引。   2、构建RAMDirectory,把索引放到内存中,以提高检索效率。   3、构建Lucene自定义分词。   4、修改Lucene默认的打分算法。

2015-07-08 16:55:58