java

关注公众号 jb51net

关闭
首页 > 软件编程 > java > SpringBoot 敏感词过滤

SpringBoot实现敏感词过滤功能示例

作者:彭于晏Yan

本文主要介绍了SpringBoot实现敏感词过滤功能示例,文中通过示例代码介绍的非常详细,对大家的学习或者工作具有一定的参考学习价值,需要的朋友们下面随着小编来一起学习学习吧

要在Spring Boot中实现敏感词过滤功能,可以使用一些现有的Java库来处理敏感词过滤,例如,可以使用 Ansj 中文分词库或者使用一些其他开源的敏感词过滤库。以下是一个使用 Ansj 实现敏感词过滤的简单示例。

1. 首先,在 pom.xml 文件中添加依赖:

<?xml version="1.0" encoding="UTF-8"?>
<project xmlns="http://maven.apache.org/POM/4.0.0"
         xmlns:xsi="http://www.w3.org/2001/XMLSchema-instance"
         xsi:schemaLocation="http://maven.apache.org/POM/4.0.0 http://maven.apache.org/xsd/maven-4.0.0.xsd">
    <modelVersion>4.0.0</modelVersion>

    <groupId>cn.cjc.demo</groupId>
    <artifactId>TestDemo</artifactId>
    <version>1.0-SNAPSHOT</version>

    <parent>
        <groupId>org.springframework.boot</groupId>
        <artifactId>spring-boot-starter-parent</artifactId>
        <version>2.6.6</version>
        <relativePath />
    </parent>

    <properties>
        <maven.compiler.source>8</maven.compiler.source>
        <maven.compiler.target>8</maven.compiler.target>
        <project.build.sourceEncoding>UTF-8</project.build.sourceEncoding>
    </properties>

    <dependencies>
        <dependency>
            <groupId>org.ansj</groupId>
            <artifactId>ansj_seg</artifactId>
            <version>5.1.2</version>
        </dependency>

    </dependencies>
    <repositories>
        <repository>
            <id>public</id>
            <name>aliyun nexus</name>
            <url>http://maven.aliyun.com/nexus/content/groups/public/</url>
            <releases>
                <enabled>true</enabled>
            </releases>
        </repository>
    </repositories>
</project>

2. 在 application.yaml 文件中添加配置:

sensitive:
  word:
    file-path: classpath:sensitive-words.txt

spring:
  main:
    allow-bean-definition-overriding: true

3. 在类路径下创建一个名为 sensitive-words.txt 的文件,其中包含敏感词列表,每个词占一行。

4. 配置 SensitiveWordFilter 过滤器的 Bean。在 Spring Boot 应用配置类中添加以下配置:

package cn.cjc.config;

import org.springframework.context.annotation.Bean;
import org.springframework.context.annotation.Configuration;

@Configuration
public class SensitiveConfig {

    @Bean
    public SensitiveWordFilter sensitiveWordFilter() {
        return new SensitiveWordFilter();
    }
}

这样,Spring 容器会自动创建 SensitiveWordFilter 的实例,并且注入所需的敏感词文件路径。在服务类或控制器中,可以通过 @Autowired 注解来注入 SensitiveWordFilter。

然后,创建一个敏感词过滤的工具类,例如 SensitiveWordFilter.java:

package cn.cjc.config;

import org.ansj.domain.Term;
import org.ansj.splitWord.analysis.ToAnalysis;
import org.springframework.beans.factory.annotation.Value;
import org.springframework.core.io.Resource;
import org.springframework.stereotype.Component;
import org.springframework.util.FileCopyUtils;

import javax.annotation.PostConstruct;
import java.io.IOException;
import java.util.HashSet;
import java.util.List;
import java.util.Set;

@Component
public class SensitiveWordFilter {

    @Value("${sensitive.word.file-path}")
    private Resource sensitiveWordFile;

    private Set<String> sensitiveWords;

    @PostConstruct
    public void init() {
        this.sensitiveWords = loadSensitiveWords();
    }

    private Set<String> loadSensitiveWords() {
        Set<String> words = new HashSet<>();
        try {
            // 从敏感词文件中加载敏感词
            String content = new String(FileCopyUtils.copyToByteArray(sensitiveWordFile.getInputStream()), "UTF-8");
            String[] wordArray = content.split("\n");
            for (String word : wordArray) {
                words.add(word.trim());
            }
        } catch (IOException e) {
            e.printStackTrace();
        }
        return words;
    }

    public String filterSensitiveWords(String input) {
        List<Term> terms = ToAnalysis.parse(input).getTerms();
        StringBuilder filteredText = new StringBuilder(input);
        for (Term term : terms) {
            if (sensitiveWords.contains(term.getName())) {
                // 将敏感词替换为*
                replaceSensitiveWord(filteredText, term.getName());
            }
        }
        return filteredText.toString();
    }

    private void replaceSensitiveWord(StringBuilder text, String sensitiveWord) {
        int index = text.indexOf(sensitiveWord);
        while (index != -1) {
            text.replace(index, index + sensitiveWord.length(), "*");
            index = text.indexOf(sensitiveWord, index + 1);
        }
    }
}

5. 在服务类或控制器中使用 SensitiveWordFilter 进行敏感词过滤:

package cn.cjc.controller;

import cn.cjc.config.SensitiveWordFilter;
import org.springframework.web.bind.annotation.PostMapping;
import org.springframework.web.bind.annotation.RequestParam;
import org.springframework.web.bind.annotation.RestController;

import javax.annotation.Resource;

@RestController
public class TestController {

    @Resource
    private SensitiveWordFilter sensitiveWordFilter;

    @PostMapping("/filter")
    public String filterSensitiveWords(@RequestParam String input) {
        return sensitiveWordFilter.filterSensitiveWords(input);
    }
}

这只是一个简单的敏感词过滤的实现示例。在实际应用中,可能需要更复杂的算法或结合其他库来进行更全面的敏感词过滤。

到此这篇关于SpringBoot实现敏感词过滤功能示例的文章就介绍到这了,更多相关SpringBoot 敏感词过滤内容请搜索脚本之家以前的文章或继续浏览下面的相关文章希望大家以后多多支持脚本之家!

您可能感兴趣的文章:
阅读全文