docker

关注公众号 jb51net

关闭
首页 > 网站技巧 > 服务器 > 云和虚拟化 > docker > docker 配置中文分词器

docker 安装solr8.6.2 配置中文分词器的方法

作者:smbot

这篇文章主要介绍了docker 安装solr8.6.2 配置中文分词器的方法,本文给大家介绍的非常详细,对大家的学习或工作具有一定的参考借鉴价值,需要的朋友可以参考下

一、环境版本

Docker version 19.03.12

centos7

solr8.6.2

二、docker安装

1.使用官方安装脚本自动安装

curl -fsSL https://get.docker.com | bash -s docker --mirror Aliyun

2.使用国内 daocloud 一键安装命令:

curl -sSL https://get.daocloud.io/docker | sh

三、docker安装solr8.6.2 1.docker拉取solr

docker pull solr

2.创建并允许solr容器

docker run --name blog-solr -d -p 8983:8983 solr // blog-solr这个可用自行命名

// 参数详解

run 运行容器
-d 后台运行
-p 容器端口和宿机端口映射
– name 容器名称
blog-solr 指镜像名称

3.创建核心

docker exec -it --user=solr blog-solr bin/solr create_core -c Ik_core

在这里插入图片描述

出现 Created new core ‘Ik_core' 即创建超过

4.浏览器访问

浏览器输入 IP:8983 访问 我这里是服务器上搭建的

在这里插入图片描述

5.solr配置中文分词器 5.2 下载Ik文件

链接: https://pan.baidu.com/s/1pkI9ZCThkDdzj4MWg3MO9A 提取码: pgv8

// 创建创建个目录将解压的文件放在这里mkdir /mnt/Ik/

在这里插入图片描述

5.2 复制配置文件

docker cp ik-analyzer-8.3.0.jar blog-solr:/opt/solr-8.6.2/server/solr-webapp/webapp/WEB-INF/lib/
docker cp ik-analyzer-solr7-7.x.jar blog-solr:/opt/solr-8.6.2/server/solr-webapp/webapp/WEB-INF/lib/
docker cp solr-dataimporthandler-8.4.0.jar blog-solr:/opt/solr-8.6.2/server/solr-webapp/webapp/WEB-INF/lib/
docker cp solr-dataimporthandler-extras-8.4.0.jar blog-solr:/opt/solr-8.6.2/server/solr-webapp/webapp/WEB-INF/lib/

进入solr容器创建文件夹

docker exec -it --user=root blog-solr /bin/bash
cd /opt/solr-8.6.2/server/solr-webapp/webapp/WEB-INF
mkdir classes
exit
docker cp IKAnalyzer.cfg.xml blog-solr:/opt/solr-8.6.2/server/solr-webapp/webapp/WEB-INF/classes/

5.3 IKAnalyzer.cfg.xml

<?xml version="1.0" encoding="UTF-8"?>
<!DOCTYPE properties SYSTEM "http://java.sun.com/dtd/properties.dtd">

<properties>
	<comment>IK Analyzer 扩展配置</comment>
		<!--用户可以在这里配置自己的扩展字典 -->
	<entry key="ext_dict">ext.dic;</entry>
		<!--用户可以在这里配置自己的扩展停止词字典-->
	<entry key="ext_stopwords">stopword.dic;</entry>
</properties>

5.4 修改managed-schema

docker exec -it --user=root blog-solr /bin/bash
cp /opt/solr-8.6.2/contrib/analysis-extras/lucene-libs/lucene-analyzers-smartcn-8.6.2.jar /opt/solr-8.6.2/server/solr-webapp/webapp/WEB-INF/lib/
cd /var/solr/data/Ik_core/conf
vim managed-schema 

如果没有vim可以使用vi 或者使用apt-get install vim 安装

在最下面添加:

<!-- ik分词器 -->
 <fieldType name="text_ik" class="solr.TextField">
	 <analyzer type="index">
		 <tokenizer class="org.wltea.analyzer.lucene.IKTokenizerFactory" useSmart="false" conf="ik.conf"/>
		 <filter class="solr.LowerCaseFilterFactory"/>
	 </analyzer>
	 <analyzer type="query">
		 <tokenizer class="org.wltea.analyzer.lucene.IKTokenizerFactory" useSmart="true" conf="ik.conf"/>
		 <filter class="solr.LowerCaseFilterFactory"/>
	 </analyzer>
 </fieldType>

 <fieldType name="text_cn" class="solr.TextField" positionIncrementGap="100">
	 <analyzer type="index">
		 <tokenizer class="org.apache.lucene.analysis.cn.smart.HMMChineseTokenizerFactory"/>
	 </analyzer>
	 <analyzer type="query">
		 <tokenizer class="org.apache.lucene.analysis.cn.smart.HMMChineseTokenizerFactory"/>
	 </analyzer>
 </fieldType>

在这里插入图片描述

5.5 修改solrconfig.xml

在最下面添加

<requestHandler name="/dataimport" class="org.apache.solr.handler.dataimport.DataImportHandler"> 
 <lst name="defaults">
  <str name="config">db-data-config.xml</str> 
 </lst> 
</requestHandler> 

在这里插入图片描述

重启solr

exit
docker restart blog-solr

四、测试

1.查看分词器是否配置成功

在这里插入图片描述

2.测试分词器是否能够正常分词

在这里插入图片描述

3.测试搜索功能

在这里插入图片描述

到此这篇关于docker 安装solr8.6.2 配置中文分词器的方法的文章就介绍到这了,更多相关docker 配置中文分词器内容请搜索脚本之家以前的文章或继续浏览下面的相关文章希望大家以后多多支持脚本之家!

您可能感兴趣的文章:
阅读全文