侧边栏壁纸
博主头像
拾荒的小海螺博主等级

只有想不到的,没有做不到的

  • 累计撰写 195 篇文章
  • 累计创建 19 个标签
  • 累计收到 0 条评论

目 录CONTENT

文章目录
OPS

Docker:安装RediSearch全文搜索

拾荒的小海螺
2024-05-09 / 0 评论 / 0 点赞 / 13 阅读 / 10780 字

1、简述

在本文中,我们将介绍如何使用Docker快速、简便地安装RediSearch,Redis的全文搜索模块。RediSearch提供了高效的全文搜索功能,通过Docker安装,可以轻松地在任何环境中部署和管理RediSearch。

image-rzvn.png

官网地址:https://github.com/RediSearch/RediSearch.git

2、性能

RediSearch是Redis的一个模块,用于实现全文搜索功能。它建立在Redis之上,利用其高性能和灵活性,为用户提供了快速、实时的搜索能力。RediSearch支持各种搜索功能,包括全文搜索、模糊搜索、排序、过滤等,适用于各种场景,如搜索引擎、内容管理系统、电子商务平台等。

  • 索引构建
    在索引构建测试中,RediSearch 用221秒的速度超过了 Elasticsearch的349秒,领先58%。

image-qsjd.png

  • 查询性能
    数据集建立索引后,我们使用运行在专用负载生成器服务器上的 32 个客户端启动了两个词的搜索查询。如下图所示,RediSearch 的吞吐量达到了 12.5K ops/sec,而 Elasticsearch 的吞吐量达到了 3.1K ops/sec,快了 4 倍。此外,RediSearch 的延迟稍好一些,平均为 8 毫秒,而 Elasticsearch 为 10 毫秒。

image-qdtn.png由此可见,RediSearch 在性能上对比 Elasticsearch 有比较大的优势。

3、安装

首先,确保您已经安装了Docker。然后,我们将通过Docker Hub上的官方RediSearch镜像来安装RediSearch。

打开终端或命令行界面,在其中运行以下命令来拉取RediSearch镜像:

docker pull redislabs/redisearch:latest

运行以下命令启动RediSearch容器:

docker run --name redis-search --restart=always -p 6379:6379 -d redislabs/redisearch:latest 

或者

docker run -d --name redis-stack-server --restart=always -p 6379:6379 redis/redis-stack-server:latest

这条命令会从Docker Hub拉取最新版本的RediSearch镜像并在名为redis-search的容器中运行它。参数-p 6379:6379将容器内的6379端口映射到主机的6379端口上。

通过docker exec指令确认当前RediSearch安装是否成功:

[root@localhost ~]# docker exec -it redis-search /bin/bash
root@fb0aa7b3b11b:/data# redis-cli
127.0.0.1:6379> module list
1) 1) "name"
   2) "search" # 查看是否包含search模块
   3) "ver"
   4) (integer) 20015

4、指令

RediSearch模块提供了一系列用于操作全文搜索索引的指令,以下是这些指令的详细解释及示例:

  • FT.CREATE:创建一个新的全文搜索索引。
FT.CREATE index_name SCHEMA field1 type [field2 type ...]

示例:

FT.CREATE idx:goods on hash prefix 1 "goods:" language chinese schema goodsName text sortable

FT.CREATE 创建索引命令
idx:goods 索引名称
on hash 索引数据基于hash类型源数据构建
prefix 1 "goods:" 表示要创建索引的源数据前缀匹配规则
language chinese 表示支持中文语言分词
schema 表示字段定义,goodsName元数据属性名 text字段类型 sortable自持排序
  • FT.ADD:向索引中添加一个新文档。
FT.ADD index_name document_id score [NOSAVE] [REPLACE] [LANGUAGE lang] [PAYLOAD payload]FIELDS field1 value1 [field2 value2 ...]

示例:

FT.ADD idx:goods doc1 1.0 FIELDS title "RedisSearch Introduction" body "RedisSearch is a full-text search engine built on top of Redis"

docId: 这里说是id并不代表只能说数字,可以是字符串。作为document的唯一标识。
score: 评分,类似于zset里的score,范围从0~1,如果不知道打多少可以默认打1。
NOSAVE:如果开启该选项我们不会在索引时保存真正的document。
REPLACE:更新或者插入,删除原本的document
PARTIAL (only applicable with REPLACE):在replace的时候指定对应的列
FIELDS: 字段对应create index时的schema
PAYLOAD {payload}: 在查询的时候使用,还不是太理解。。。
IF {condition}: 配合replace使用,对判断语句进行判断后决定是否生效replace e.g. FT.ADD idx doc 1 REPLACE IF "@timestamp < 23323234234".
LANGUAGE language: 指定语言,可以是中文:chinese
  • FT.SEARCH:在索引中执行全文搜索。
FT.SEARCH index_name query [NOCONTENT] [VERBATIM] [NOSTOPWORDS] [WITHSCORES] [WITHSORTKEYS] [FILTER field value [field value ...]]
           [GEOFILTER field lon lat radius m|km|mi|ft] [INKEYS num_keys key [key ...]] [INFIELDS num_fields field [field ...]]
           [RETURN num_docs [ASC|DESC]] [SUMMARIZE [FIELDS num_fields field [field ...]] LEN len FRAGS frags]
           [HIGHLIGHT [FIELDS num_fields field [field ...]] [TAGS open close] [FRAGS frags] [LEN len] [SEPARATOR sep] [MAXLEN len] [ELIPSIS ellipsis]]
           [SLOP slop] [INORDER] [LANGUAGE lang] [EXPANDER expander] [SCORER scorer] [PAYLOAD]

示例:

FT.SEARCH idx:goods "RedisSearch"
  • FT.AGGREGATE:在索引中执行聚合操作。
FT.AGGREGATE index_name query [LOAD [NUM num] [TERMS term [..]] [PROPERTIES prop [..]] [GROUPBY field [..]] [REDUCE reduce_function | REDUCER reduce_function]] [APPLY function [..]] [FILTER filter [..]] [SORTBY field [asc|desc] | MAX num [BY field [asc|desc]] [MAXTERMS num] [WITHCURSOR] [WITHFILTER] [WITHSORTKEYS]

示例:

FT.AGGREGATE idx:goods "*" GROUPBY 1 @title REDUCE COUNT 0 AS num_docs
  • FT.INFO:获取索引的信息。
FT.INFO index_name

示例:

FT.INFO idx:goods 
  • FT.DROPINDEX:删除指定的索引。
FT.DROPINDEX index_name [DD]

示例:

FT.DROPINDEX idx:goods 

以上是RediSearch模块中常用的指令及其详细解释和示例。通过这些指令,您可以在Redis中轻松构建和管理全文搜索索引,并执行各种搜索和聚合操作。

5、应用

接下来,我们将展示如何使用Java来连接到RediSearch并进行查询。我们将使用Jedis作为Redis的Java客户端库,确保您已经将其添加到项目依赖中:

<parent>
    <groupId>org.springframework.boot</groupId>
    <artifactId>spring-boot-starter-parent</artifactId>
    <version>3.2.5</version>
    <relativePath/> <!-- lookup parent from repository -->
</parent>
//jedis 4.0以上版本就默认支持RediSearch
<dependency>
    <groupId>redis.clients</groupId>
    <artifactId>jedis</artifactId>
    <version>5.1.0</version>
</dependency>

以下是一个简单的Java类,演示了如何连接到RediSearch并执行一个简单的全文搜索查询:

package com.example.lkfy.example;

import org.apache.commons.lang.StringUtils;
import org.apache.commons.pool2.impl.GenericObjectPoolConfig;
import org.springframework.beans.factory.annotation.Autowired;
import redis.clients.jedis.*;
import redis.clients.jedis.search.*;

import java.time.Duration;
import java.util.HashMap;
import java.util.Map;
import java.util.Set;

public class RedisSearchExample {
    public static final String GOODS_IDX_PREFIX = "idx:goods:";


    @Autowired
    private UnifiedJedis client;

    public RedisSearchExample() {
        GenericObjectPoolConfig jedisPoolConfig = new JedisPoolConfig();
        jedisPoolConfig.setMaxIdle(10);
        jedisPoolConfig.setMaxWaitMillis(3000);
        jedisPoolConfig.setJmxEnabled(false);
        client = new JedisPooled(jedisPoolConfig, "192.168.157.128", 6379, 1000, "123456",0);
    }

    /**
     * 新增索引数据
     */
    private void hset(String keyPrefix, Map<String, String> hash) {
        // 支持中文
        hash.put("_language", "chinese");
        client.hset(keyPrefix, hash);
    }
    /**
     * 查询索引列表
     */
    public Set<String> listIndex() {
        return client.ftList();
    }


    /**
     * 创建索引
     *
     * @param idxName 索引名称
     * @param prefix  要索引的数据前缀
     * @param schema  索引字段配置
     */
    public void createIndex(String idxName, String prefix, Schema schema) {
        IndexDefinition rule = new IndexDefinition(IndexDefinition.Type.HASH)
                .setPrefixes(prefix)
                .setLanguage("chinese");
        client.ftCreate(idxName,
                IndexOptions.defaultOptions().setDefinition(rule),
                schema);
    }

    /**
     * 查询
     *
     * @param idxName 索引名称
     * @param search  查询key
     * @param sort    排序字段
     * @return searchResult
     */
    public SearchResult query(String idxName, String search, String sort) {
        Query q = new Query(search);
        if (StringUtils.isNotBlank(sort)) {
            q.setSortBy(sort, false);
        }
        q.setLanguage("chinese");
        q.limit(0, 10);
        return client.ftSearch(idxName, q);
    }


    public static void main(String[] args) {
        RedisSearchExample example = new RedisSearchExample();
        String id ="1";
        Map<String, String> hash = new HashMap<>();
        hash.put("id",id);
        hash.put("goodsName","你好hello");
        example.hset("idx:goods" , hash );
        SearchResult searchResult = example.query("idx:goods","*", null);
        System.out.println(searchResult.toString());
    }

}

6、优点和场景

RediSearch是Redis的全文搜索模块,具有以下优点和适用场景:

6.1 优点

  • 快速高效: RediSearch基于倒排索引实现,具有高效的全文搜索能力,能够快速地处理大量文本数据。
  • 与Redis集成: RediSearch是作为Redis模块而不是单独的软件包提供的,因此可以与现有的Redis部署集成,无需额外的基础设施或管理开销。
  • 分布式支持: RediSearch支持分布式部署,可以水平扩展以处理大量的搜索请求。
  • 丰富的搜索功能: 提供了丰富的搜索功能,包括全文搜索、模糊搜索、排序、过滤等,能够满足各种搜索需求。
  • 实时索引更新: 支持实时索引更新,可以在数据变更时立即更新索引,保持搜索结果的实时性。
  • 轻量级: RediSearch是一个轻量级的模块,易于安装、部署和管理。

6.2 应用场景:

  • 实时搜索引擎: 适用于构建实时搜索引擎,能够快速地处理用户的搜索请求,并返回相关的搜索结果。
  • 内容管理系统: 可以用于构建内容管理系统,支持对大量文本数据进行全文搜索、过滤和排序。
  • 电子商务平台: 用于构建电子商务平台的搜索功能,支持商品搜索、过滤和排序,提供更好的用户搜索体验。
  • 社交网络: 适用于构建社交网络平台,支持用户搜索、内容搜索等功能。
  • 日志分析: 可以用于实时分析和搜索日志数据,支持日志检索、过滤和分析。
  • 实时推荐系统: 用于构建实时推荐系统,支持对用户喜好进行实时搜索和推荐。

总的来说,RediSearch具有高效、快速、易于集成和扩展的特点,适用于各种需要全文搜索功能的应用场景。

7、总结

通过本文,您学习了如何使用Docker快速、简便地安装RediSearch。RediSearch是Redis的全文搜索模块,提供了高效、实时的全文搜索功能,适用于各种场景。使用Docker安装RediSearch可以轻松地在任何环境中部署和管理RediSearch,为您的应用程序提供强大的全文搜索能力。希望本文对您有所帮助!

0

评论区