Fork me on GitHub
ShenWenFang


  • 首页

  • 标签

  • 分类

  • 归档

  • 搜索

lucene 综合应用实例

发表于 2019-03-16 | 分类于 lucene | 阅读次数:
字数统计: 2,773 字 | 阅读时长 ≈ 14 分钟

lucene(20)—lucene 综合应用实例

最近因项目需求的需要,完成一个”会话检索”功能。该功能是把录音转写成文字,对转写后的文本进行关键字检索。因为该功能对检索条件类型的使用比较完整(例如:时间范围、关键字、语速等不同类型)以及使用的注意点也比较多,所以在这里给大家分享一下。希望可以帮到你。

阅读全文 »

lucene增量更新和NRT(near-real-time)Query近实时查询

发表于 2019-03-16 | 分类于 lucene | 阅读次数:
字数统计: 2,398 字 | 阅读时长 ≈ 11 分钟

lucene(19)—lucene增量更新和NRT(near-real-time)Query近实时查询

有时候我们创建完索引之后,数据源可能有更新的内容,而我们又想像数据库那样能直接体现在查询中,这里就是我们所说的增量索引。对于这样的需求我们怎么来实现呢?lucene内部是没有提供这种增量索引的实现的;

阅读全文 »

lucene的IndexWriter对象创建和索引策略的选择

发表于 2019-03-16 | 分类于 lucene | 阅读次数:
字数统计: 3,751 字 | 阅读时长 ≈ 17 分钟

lucene(1)—lucene的IndexWriter对象创建和索引策略的选择

因工作的需要(数据量大造成原有系统查询效率低),最近做了搜索引擎相关的内容,选择了lucene5版本(15年发布的)。

阅读全文 »

lucene索引时join和查询时join使用示例

发表于 2019-03-16 | 分类于 lucene | 阅读次数:
字数统计: 1,524 字 | 阅读时长 ≈ 7 分钟

lucene(18)—lucene索引时join和查询时join使用示例

了解sql的朋友都知道,我们在查询的时候可以采用join查询,即对有一定关联关系的对象进行联合查询来对多维的数据进行整理。这个联合查询的方式挺方便的,跟我们现实生活中的托人找关系类似,我们想要完成一件事,先找自己的熟人,然后通过熟人在一次找到其他,最终通过这种手段找到想要联系到的人。有点类似于”世间万物皆有联系“的感觉。

阅读全文 »

lucene搜索之expressions表达式处理

发表于 2019-03-16 | 分类于 lucene | 阅读次数:
字数统计: 1,133 字 | 阅读时长 ≈ 6 分钟

lucene(17)—lucene搜索之expressions表达式处理

有时候我们在做lucene的结果展示的时候可能需要对多个列的内容进行计算,根据多个field对应的值做数值方面的运算。

lucene自4.6版本起,提供了用于运算的expression模块;

阅读全文 »

lucene搜索之facet查询查询示例(2)

发表于 2019-03-16 | 分类于 lucene | 阅读次数:
字数统计: 1,041 字 | 阅读时长 ≈ 5 分钟

lucene(16)—lucene搜索之facet查询查询示例(2)

lucene(14)—lucene搜索之facet索引原理和facet查询实例,上篇主要是统计facet的dim和每个种类对应的数量,个人感觉这个跟lucene的group不同的在于facet的存储类似于hash(key-field-value)形式的,而group则是单一的map(key-value)形式的,虽然都可以统计某一品类的数量,显然facet更具扩展性。

阅读全文 »

java读取word excel pdf及lucene搜索之正则表达式查询RegExQuery和手机邮箱查询示例

发表于 2019-03-16 | 分类于 lucene | 阅读次数:
字数统计: 2,358 字 | 阅读时长 ≈ 13 分钟

lucene(15)—java读取word excel pdf及lucene搜索之正则表达式查询RegExQuery和手机邮箱查询示例

读取文本文件中的内容,找出文件中的手机号和邮箱,我自己写了一个读取文档的内容的正则查询示例,用于匹配文件中是否含有邮箱或者手机号,这个等于是对之前的文本处理工具的一个梳理,同时结合lucene内部提供的正则匹配查询RegexQuery;

废话不多说了,直接上代码,这里先对文件内容读取分类处理,分为pdf word excel 和普通文本四类,不同的种类读取文本内容不一样

pdf利用pdfbox读取内容,word和excel利用poi进行读取内容,文本文档利用jdk自带的读取

阅读全文 »

lucene搜索之facet查询原理和facet查询实例

发表于 2019-03-16 | 分类于 lucene | 阅读次数:
字数统计: 1,878 字 | 阅读时长 ≈ 10 分钟

lucene(14)—lucene搜索之facet查询原理和facet查询实例

Facet说明

我们在浏览网站的时候,经常会遇到按某一类条件查询的情况,这种情况尤以电商网站最多,以天猫商城为例,我们选择某一个品牌,系统会将该品牌对应的商品展示出来,效果图如下:

阅读全文 »
1…567…12
ShenWenFang

ShenWenFang

每一个你不满意的现在,都有一个你没有努力的曾经。

96 日志
36 分类
23 标签
RSS
© 2017 — 2020 ShenWenFang