Lucene

Lucene是apache软件基金会4 jakarta项目组的一个子项目,是一个开放源代码的全文检索引擎工具包,即它不是一个完整的全文检索引擎,而是一个全文检索引擎的架构,提供了完整的查询引擎和索引引擎,部分文本分析引擎(英文与德文两种西方语言)。

基于.Net Framework 3.5的Lucene.Net 中文词组匹配分词器

可以自己看看是不是很高效。为了加快速度,尽量精简了算法。测试表明,精确度还可以。由于没有实现完整的一套字典机制,而是普通的文本字典,所以就不提供完整源码下载了,贴出核心的源码。从版本完整度上来说只能算是0.6版。另外,本分词系统使用的词库是ShootAnalyzer的词库。使用方法:参考以下代码  1   &nbsp

2015-07-08 16:56:45

Lucene中的Analyzer

阅读下面文章之前,建议先阅读随风的DotLucene源码浅读笔记(1) : Lucene.Net.Analysis 了解Lucene的Analyzer由于lucene中自带的几个Analyzer不能满足业务需求,要自定义Analyzer所以参考lucene中自带的几个Analyzer的实现。在参考的过程中,发现KeywordAnalyzer可以简化

2015-07-08 16:56:45

lucene中FSDirectory、RAMDirectory的用法

package com.ljq.one; import java.io.BufferedReader; import java.io.File; import java.io.FileInputStream; import java.io.InputStreamReader; import org.apache.lucene.a

2015-07-08 16:56:44

Lucene 4.8 - Facet Demo

package com.fox.facet; /* * Licensed to the Apache Software Foundation (ASF) under one or more * contributor license agreements. See the NOTICE file distributed with *

2015-07-08 16:56:44

lucene.net 2.0 中文分词后语法高亮问题

lucene.net 2.0  src包里自带了Highlighter.Net-2.0.0,可以用来实现语法高亮。    //定义多条件搜索分析器  BooleanQuery bquery = new BooleanQuery();   //定义分词器&nbs

2015-07-08 16:56:43

Lucene关于实现Similarity自定义排序

开场白: 作为一个人才网站的搜索功能,不但需要考滤搜索性能与效率,与需要注意用户体验,主要体现于用户对搜索结果的满意程度.大家都知道Lucene的排序中,如果单纯使用Lucene的DefaultSimilarity作为一个相似度的排序,意思是说总体上越相关的记录需要排得越前,但事与愿违.这样使用户体现也表现得相当糟糕.关键字\"程序员\"标题中也不

2015-07-08 16:56:43

Lucene索引核心类研究

简单的建立索引和查询索引并不难,关键在于他的二次开发,让他适合你自己的需求 既然要二次开发就必须查看源码  首先看看索引过程中的核心类吧:  IndexWriter       这个是核心组件, 建立和打开索引,以及向文档中添加、删除或更新被索引文档的信息。  Directory

2015-07-08 16:56:43

Lucene.Net+盘古分词器(详细介绍)

Lucene.Net+盘古分词器(详细介绍) 本章阅读概要 1、Lucenne.Net简介 2、介绍盘古分词器 3、Lucene.Net实例分析 4、结束语(Demo下载) Lucene.Net简介   Lucene.net是Lucene的.net移植版本,是一个开源的全文检索引擎开发包,即它不是一个完整的全文检索引擎,而是一个全文检索引擎

2015-07-08 16:56:42

[ lucene扩展 ] spellChecker原理分析

spellChecker是用来对用户输入的“检索内容”进行校正,例如百度上搜索“麻辣将”,他的提示如下图所示:  我们首先借用lucene简单实现该功能。 本文内容如下(简单实现、原理简介、现有问题)     lucene中spellchecker简述 luce

2015-07-08 16:56:42

使用Lucene检索文档中的关键字

1.为要处理的文件内容建立索引 4.文件预处理工具类文件创建索引类LuceneSearch package org.dennisit.study.lucene.process; import java.io.BufferedReader; import java.io.File; import java.io.FileReader; im

2015-07-08 16:56:42

Lucene使用Filter搜索过滤

  1 /** 2 * 排序查询 3 * 4 * @param querystr 5 * 查找匹配的字符串 6 * @param domain 7 * 查找内容的域 8 * @param f

2015-07-08 16:56:41

Lucene.net基本功能核心代码

1. 基本应用 using System; using System.Collections.Generic; using System.Text; using Lucene.Net; using Lucene.Net.Analysis; using Lucene.Net.Analysis.Standard; using Lucene

2015-07-08 16:56:41

解读Lucene.Net ——二、 InputStream 之二

InputStream类有两个子类,RAMInputStream和FSInputStream。 RAMInputStream这个类比较简单,由于父类已经实现了ICloneable接口,这里只是一个形式上的实现。RAMInputStream内聚了一个RAMFile对象。它最复杂的部分,就是重写抽象方法ReadInternal。 代码 2-12 pu

2015-07-08 16:56:40

一步一步学lucene——(第三步:索引篇)

在前面概要的了解了lucene的内容下面就深入一下lucene的各个模块。这里我们主要深入一下lucene的索引,就是如何构建索引的过程及概念。 lucene与关系型数据库 从两个角度比较一下吧,一个是从索引方面,一个是模糊查询,其实归为一类的化就是全文检索的对比。 1、索引的对比 对比项 全文检索库(Lucene) 关系型数据库

2015-07-08 16:56:40

编程点滴.LUCENE.Luke查询工具

Luke是使用Lucene进行开发必不可少的一个工具.下载地址 它是一个Java开发的Lucene辅助工具.所以还得安装Java虚拟机.下载地址 下面对其功能做简单的介绍. 图1. 当打开Luke时就会出现图1.的样子. 最主要的就是要打开的索引路径\"Path\",紧跟着的选项是(已只读方式打开,和解锁) 以及打开方式及其选项等. &n

2015-07-08 16:56:40

1.用lucene为数据库建索引

一,lucene中比较基础的建立索引步骤(资料:http://www.ourys.com/post/lucene3-0_database_index.html) 1.指定目录索引 2.创建Directory对象(参数是存放索引的File类型,根据File的存放地点选择创建类) 3.创建indexWriter对象,参数(Directory对象,分词器,是

2015-07-08 16:56:39

lucene files

                              &nb

2015-07-08 16:56:38

lucene对日期(date)和整形(int)处理

项目结构: 运行效果: ========================================== 代码部分: ========================================== /lucene_0400_dateAndInt/src/com/b510/lucene/util/LuceneUtil.java

2015-07-08 16:56:38

使用Lucene.NET实现简单的站内搜索

使用Lucene.NET实现简单的站内搜索 导入Lucene.NET 开发包 Lucene 是apache软件基金会一个开放源代码的全文检索引擎工具包,是一个全文检索引擎的架构,提供了完整的查询引擎和索引引擎,部分文本分析引擎。Lucene的目的是为软件开发人员提供一个简单易用的工具包,以方便的在目标系统中实现全文检索的功能,或者是以此为基础

2015-07-08 16:56:38

Lucene.Net RangeQuery 效率确实低下

Lucene.Net RangeQuery 效率确实低下    很多文章提到 Lucene.Net RangeQuery 的查询效率非常低下,我今天测试了一下,果然非常低下,而且结果也不正确。  测试 代码: 索引        &nb

2015-07-08 16:56:37