Solr如何管理索引库

索引创建和搜索过程

1.创建索引

举例子：

文档一：solr是基于Lucene开发的企业级搜索引擎技术

文档二：Solr是一个独立的企业级搜索应用服务器，Solr是一个高性能，基于Lucene的全文搜索服务器

首先经过分词器分词，solr会为分词后的结果（词典）创建索引，然后将索引和文档id列表对应起来，如下图所示：

比如：solr在文档1和文档2中都有出现，所以对应的文档ID列表中既包含文档1的ID也包含文档2的ID，文档ID列表对应到具体的文档，并体现该词典在该文档中出现的频次，频次越多说明权重越大，权重越大搜索的结果就会排在前面。

solr内部会对分词的结果做如下处理：

1.去除停词和标点符号，例如英文的this，that等，中文的“的”，“一”等没有特殊含义的词

2.会将所有的大写英文字母转换成小写，方便统一创建索引和搜索索引

3.将复数形式转为单数形式，比如students转为student，也是方便统一创建索引和搜索索引

2.索引搜索过程

知道了创建索引的过程，那么根据索引进行搜索就变得简单了。

1.用户输入搜索条件

2.对搜索条件进行分词处理

3.根据分词的结果查找索引

4.根据索引找到文档ID列表

5.根据文档ID列表找到具体的文档，根据出现的频次等计算权重，最后将文档列表按照权重排序返回

使用SolrJ管理索引库

使用SolrJ可以实现索引库的增删改查操作。

3.1 添加文档

第一步：把solrJ的jar包添加到工程中。

第二步：创建一个SolrServer，使用HttpSolrServer创建对象。

第三步：创建一个文档对象SolrInputDocument对象。

第四步：向文档中添加域。必须有id域，域的名称必须在schema.xml中定义。

第五步：把文档添加到索引库中。

第六步：提交。

3.2 删除文档

3.2.1 根据id删除

第一步：创建一个SolrServer对象。

第二步：调用SolrServer对象的根据id删除的方法。

第三步：提交。

3.2.2 根据查询删除

3.3 查询索引库

第一步：创建一个SolrServer对象

第二步：创建一个SolrQuery对象。

3 向SolrQuery中添加查询条件、过滤条件。。。

第四步：执行查询。得到一个Response对象。

5 取查询结果。

第六步：遍历结果并打印。

3.3.1 简单查询

3.3.2 带高亮显示

@Test

public void searchDocumet（） throws Exception {

// 创建一个SolrServer对象

SolrServer solrServer = new HttpSolrServer（“http://101.132.69.111:8080/solr/collection1”）;

// 创建一个SolrQuery对象

SolrQuery query = new SolrQuery（）;

// 设置查询条件、过滤条件、分页条件、排序条件、高亮

// query.set（“q”， “*：*”）;

query.setQuery（“手机”）;

// 分页条件

query.setStart（0）;

query.setRows（30）;

// 设置默认搜索域

query.set（“df”， “item_keywords”）;

// 设置高亮

query.setHighlight（true）;

// 高亮显示的域

query.addHighlightField（“item_title”）;

query.setHighlightSimplePre（“《div》”）;

query.setHighlightSimplePost（“《/div》”）;

// 执行查询，得到一个Response对象

QueryResponse response = solrServer.query（query）;

// 取查询结果

SolrDocumentList solrDocumentList = response.getResults（）;

// 取查询结果总记录数

System.out.println（“查询结果总记录数：” + solrDocumentList.getNumFound（））;

for （SolrDocument solrDocument ： solrDocumentList） {

System.out.println（solrDocument.get（“id”））;

// 取高亮显示

Map《String， Map《String， List《String》》》 highlighting = response.getHighlighting（）;

List《String》 list = highlighting.get（solrDocument.get（“id”））.get（“item_title”）;

String itemTitle = “”;

if （list ！= null && list.size（）》 0） {

itemTitle = list.get（0）;

} else {

itemTitle = （String） solrDocument.get（“item_title”）;

}

System.out.println（itemTitle）;

System.out.println（solrDocument.get（“item_sell_point”））;

System.out.println（solrDocument.get（“item_price”））;

System.out.println（solrDocument.get（“item_image”））;

System.out.println（solrDocument.get（“item_category_name”））;

System.out.println（“=============================================”）;

}

4. Solr服务器中的后台数据处理

这个其实是通过图形界面操作，只需手动填写查询条件，不需要进行代码处理。但是实际项目开发中，还是需要进行代码编写的。

4.1 solr的基础语法

q 查询的关键字，此参数最为重要，例如，q=id:1，默认为q=*：*，

fq （filter query）过虑查询，提供一个可选的筛选器查询。

返回在q查询符合结果中同时符合的fq条件的查询结果

sort 排序方式，例如id desc 表示按照 “id” 降序

start 返回结果的第几条记录开始，一般分页用，默认0开始

rows 指定返回结果最多有多少条记录，默认值为 10，配合start实现分页

fl 指定返回哪些字段，用逗号或空格分隔，注意：字段区分大小写，例如，fl= id，title，sort

df 默认的查询字段，一般默认指定

wt （writer type）指定输出格式，有 xml， json， php等

indent 返回的结果是否缩进，默认关闭

hl 高亮

hl.fl 设定高亮显示的字段

hl.requireFieldMatch 如果置为true，除非用hl.fl指定了该字段，查询结果才会被高亮。它的默认值是false。

hl.usePhraseHighlighter 如果一个查询中含有短语（引号框起来的）那么会保证一定要完全匹配短语的才会被高亮。

hl.highlightMultiTerm如果使用通配符和模糊搜索，那么会确保与通配符匹配的term会高亮。默认为false，同时hl.usePhraseHighlighter要为true。

hl.fragsize 返回的最大字符数。默认是100.如果为0，那么该字段不会被fragmented且整个字段的值会被返回。

阅读全文

服务器(82166) 服务器(82166)
索引库(6803) 索引库(6803)



请按住滑块，拖动到最右边



了解新功能

索引数组

有没有什么方法能让我索引不这麻烦，占地方，之后可能要要索引0-20个，写起来太麻烦了，想了下是不是可以用for循环，不过没成功。

2015-12-01 19:43:42

索引数组问题

怎么对 index array函数的 i 从0到10实现自动循环索引，望大虾赐教

2012-06-16 15:06:16

CAD中的索引符号都有哪些？CAD标注符号大全

说到CAD标注符号大全可能很多CAD制图初学入门的小伙伴对于CAD制图软件中的索引符号不太了解，今天就来给大家介绍CAD标注符号大全中的索引符号，其实，索引符号命令为图中另有详图的某一部分标注索引

2021-04-26 14:44:39

CAD软件中如何管理符号库？CAD符号库管理教程

在进行电气图纸弱电平面设计的过程中，经常会需要用到各种符号，那么浩辰CAD电气软件的弱电平面设计中如何管理符号库呢？接下来CAD入门学习教程中就让小编来给大家介绍一下浩辰CAD电气软件的弱电

2021-07-01 16:10:59

IndexedDB的索引使用

IndexedDB（二：索引）

2019-05-13 13:29:31

LV Nugget之数组索引的妙用

我们谈谈数组索引的用法，首先从一维数组谈起。1、一维数组的首个元素对应的索引值为0，也就是说索引从0开始，有些编程语言数组的索引是从1开始的，所以这点必须明确。2、索引数组函数中使用的数组索引端子可以

2011-11-16 13:50:57

LabVIEW Nugget之数组索引的妙用

2014-12-18 15:02:46

LabVIEW Nugget之数组索引的妙用

2014-12-18 15:03:20

MySQL索引使用优化和规范

MySQL - 索引使用优化和规范

2020-06-15 16:01:08

MySQL数据库索引的底层是怎么实现的

前言就我个人所知，MySQL目前已经作为绝大数项目的数据库选择。但是经常会需要去处理慢sql导致的各类问题。索引，作为一种常见的处理方式。思考两个问题：1.为什么加了索引以后，数据库的查询效率会加

2022-07-28 15:30:46

Pandas索引和筛选相关问题

Pandas——索引和筛选

2020-04-09 16:59:39

Proteus元件英语(快捷查找) Proteus元件库索引

Proteus元件英语(快捷查找)Proteus元件库索引

2012-08-13 18:48:20

正在加载...

林超文PCB设计：PADS教程，PADS视频教程	郑振宇老师：Altium Designer教程，Altium Designer视频教程
张飞实战电子视频教程	朱有鹏老师：海思HI3518e教程，HI3518e视频教程
李增老师：信号完整性教程，高速电路仿真教程	华为鸿蒙系统教程，HarmonyOS视频教程
赛盛：EMC设计教程，EMC视频教程	杜洋老师：STM32教程，STM32视频教程
唐佐林：c语言基础教程，c语言基础视频教程	张飞：BUCK电源教程，BUCK电源视频教程
正点原子：FPGA教程，FPGA视频教程	韦东山老师：嵌入式教程，嵌入式视频教程
张先凤老师：C语言基础视频教程	许孝刚老师：Modbus通讯视频教程
王振涛老师：NB-IoT开发视频教程	Mill老师：FPGA教程，Zynq视频教程
C语言视频教程	RK3566芯片资料合集
朱有鹏老师：U-Boot源码分析视频教程	开源硬件专题

搜索历史

Solr如何管理索引库

评论