Lucene

Lucene是apache软件基金会4 jakarta项目组的一个子项目,是一个开放源代码的全文检索引擎工具包,即它不是一个完整的全文检索引擎,而是一个全文检索引擎的架构,提供了完整的查询引擎和索引引擎,部分文本分析引擎(英文与德文两种西方语言)。

深入 Lucene 索引机制

Lucene 是一个基于 Java 的全文检索工具包,你可以利用它来为你的应用程序加入索引和检索功能。Lucene 目前是著名的 Apache Jakarta 家族中的一个开源项目,下面我们即将学习 Lucene 的索引机制以及它的索引文件的结构。 在这篇文章中,我们首先演示如何使用 Lucene 来索引文档,接着讨论如何提高索引的性能。最后我们来分析

2015-07-14 17:10:14

Lucene Thrift and Ruby

0diggThis post is going to demonstrate thrift usage by searching a Lucene index from Ruby.Thrift In a NutshellEssentially thrift is a serialization and RPC framework that allows yo

2015-07-13 11:23:38

php引入lucene搜索引擎方法.

 1、lucene包的下载地址:http://apache.etoak.com/lucene/java/3.3.0/ 2、下载jdk环境 3、下载JavaBridge URL:http://sourceforge.net/projects/php-java-bridge/ 步骤: 1安装好jdk 2下载的JavaBridge.jar拷

2015-07-10 15:12:42

elastic search,又一个基于lucene的nosql好项目

Posted by summersmile1984 in 企业搜索国内http://log.medcl.net/有关于这个的文章,是比较早研究这个项目的中文博客了基于json格式的service交互方式,不限定与某个驱动类库,比如你要使用oracle,mysql数据库,就必须要使用对应的jdbc驱动,与服务器交互使用的是其特有的

2015-07-08 18:41:44

hibernate search 和lucene结合使用实例

以下的代码是根据api帮助文档作出的一个简单实例,在应用方面可以实现创建索引,搜索,过滤和高亮的功能。 整体的环境为:spring2.5.6,hibernate3.3.1,struts2.0.8,lucene2.4.1 第一步,首先是web.xml配置文件,由于使用了ssh2的架构,所以不得不在web.xml里配置一些东西 ]<?xm

2015-07-08 18:29:04

一、lucene2.4的创建和查询及其分词显示

1、工程目录 2、lucene的创建搜索过程 3、建立索引的示意图 4、硬盘和内存中创建索引示意图 5、lucene的创建及其搜索的代码 package cn.hj.lucene.helloworld; import jeasy.analysis.MMAnalyzer; import org.apache.l

2015-07-08 16:57:43

Lucene.Net的学习心得

Lucene.Net   1.  搜索的分类: Ø  结构化数据:指具有固定格式或有限长度的数据,如数据库,元数据等。 Ø  非结构化数据:指不定长或无固定格式的数据,如邮件,word文档等。   Ø 对结构化数据的搜索:如对数据库的搜索,用SQL

2015-07-08 16:57:33

lucene....highlight应用

导入luncene contrib/ lucene-highlighter-2.0.1-dev.jar 参考 WordsHighlighterTest .java 代码 package lucene; import java.io.IOException;im

2015-07-08 16:57:32

Lucene(2.4)的检索工具类-IndexSearcher解读

package org.apache.lucene.search; /** * Licensed to the Apache Software Foundation (ASF) under one or more * contributor license agreements. See the NOTICE file distributed

2015-07-08 16:57:31

Hello, Lucene

版权声明:转载时请以超链接形式标明文章原始出处和作者信息及本声明 http://dreamhead.blogbus.com/logs/13442877.html   Lucene是什么?下面是官方回答。 Apache Lucene is a high-performance, full-featured text search en

2015-07-08 16:57:31

全文搜索 lucene使用与优化

1 lucene简介1.1 什么是luceneLucene是一个全文搜索框架,而不是应用产品。因此它并不像www.baidu.com 或者google Desktop那么拿来就能用,它只是提供了一种工具让你能实现这些产品。1.2 lucene能做什么要回答这个问题,先要了解lucene的本质。实际上lucene的功能很单一,说到底,就是你给它若干个字符串,然

2015-07-08 16:57:30

Lucene 3.6.2入门:针对索引文件的CRUD

    * @see =============================================================================================================     * @see Lucene官网:http:/

2015-07-08 16:57:29

lucene如何对搜索内容进行建模

1.文档和域       文档是lucene索引和搜索的原子单位。文档为包含一个或多个域的容器。域值可以被索引或者不被索引,如果需要搜索一个域则必须对它进行索引。二进制格式的域值只能被存储而不能为索引,在索引一个域的时候需要使用分析器将域值转换为词汇单元。

2015-07-08 16:57:27

lucene中文索引初探

lucene提供的demo程序中只支持英文的索引,下文将介绍如何在demo中添加中文索引1.下载lucene的源码和中文解析器源码其中中文解析器的下载地址是:http://svn.apache.org/repos/asf/lucene/java/trunk/contrib/2.重新打包lucene-1.4.3.jar使其包含中文解析器修改demo程序中语言解

2015-07-08 16:57:26

lucene学习的第一个例子之创建索引

以前用过lucene 3.5,近来又要用到lucene,索性学一下最新的版本,lucene从4.0之后还是做了很大的调整,比如增加了中文分词器等,jar包也比较分散,并没有全部打包在core包中。 1.添加jar包: 除了core jar包以外,还要加上分词器通用common jar包,另外一个是中文分词器的smartcn jar包。 2.按照常规

2015-07-08 16:57:23

Lucene 安装

1.在网上下载了lucene 2.2版,http://jakarta.apache.org/Lucene/ 2.然后分别安装了jdk1.6和tomcat5.5 3.建一个目录d:/lucenetest/index,在里面放一些文本文件和网页文件 4.进入dos模式,输入命令:java org.apache.lucene.demo.IndexFiles

2015-07-08 16:57:22

全文检索Lucene使用与优化

1 lucene简介 1.1 什么是lucene Lucene是一个全文搜索框架,而不是应用产品。因此它并不像www.baidu.com 或者google Desktop那么拿来就能用,它只是提供了一种工具让你能实现这些产品。   1 lucene简介 要回答这个问题,先要了解lucene的本质。实际上lucene的功能很单一,说到底,就

2015-07-08 16:57:11

用Lucene索引数据库

用Lucene索引数据库 分类: Others 2008-10-23 11:37 3958人阅读 评论(0) 收藏 举报 lucene数据库querystringnullsql server   1.写一段传统的JDBC程序,将每条的用户信息从数据库读取出来 2.针对每条用户记录,建立一个lucene doc

2015-07-08 16:57:10

Lucene中的跨度查询示例

信息源自:http://callan.javaeye.com/blog/154251 SpanQuery按照词在文章中的距离或者查询几个相邻词的查询 SpanQuery包括以下几种: SpanTermQuery:词距查询的基础,结果和TermQuery相似,只不过是增加了查询结果中单词的距离信息。 SpanFirstQuery:在指定距离可以找到第一

2015-07-08 16:57:10

一个例子学懂搜索引擎(lucene)

其实,lucene是一个很容易上手的搜索引擎框架,传统的搜索引擎,涉及到爬虫,也就是爬取网页,然后对 网页进行加工,也就是索引,最后用于搜索,lucene这个框架可以很方便的帮你做到后面两个步骤,也就是索引和搜索!本文尝试通过一个例子,使大家掌握 lucene的使用核心方法,包括分词、索引、搜索不同的目录、搜索不同的域,希望大家通过这个实例,对lucen

2015-07-08 16:57:09