java

关注公众号 jb51net

关闭
首页 > 软件编程 > java > Java计算两个汉字相似度

Java计算两个汉字相似度的实现方法

作者:老马啸西风

有时候我们希望计算两个汉字的相似度,比如文本的 OCR 等场景,用于识别纠正,本文给大家详细介绍了Java计算两个汉字相似度的实现方法,文中有详细的实现代码,需要的朋友可以参考下

计算汉字相似度

情景

有时候我们希望计算两个汉字的相似度,比如文本的 OCR 等场景。用于识别纠正。

实现

引入 maven

<dependency>
    <groupId>com.github.houbb</groupId>
    <artifactId>nlp-hanzi-similar</artifactId>
    <version>1.3.0</version>
</dependency>

java 实现

double rate1 = HanziSimilarHelper.similar('末', '未');

返回对应的相似度:

0.9629629629629629

返回一个汉字的相似列表

情景

找到相似的汉字,有很多有趣的场景。

实现

List<String> list = HanziSimilarHelper.similarList('爱');
Assert.assertEquals("[爰, 爯, 受, 爭, 妥, 憂, 李, 爳, 叐, 雙]", list.toString());

开源地址

为了便于大家学习,上述代码已开源

https://github.com/houbb/nlp-hanzi-similar

在线体验

在线体验

到此这篇关于Java计算两个汉字相似度的实现方法的文章就介绍到这了,更多相关Java计算两个汉字相似度内容请搜索脚本之家以前的文章或继续浏览下面的相关文章希望大家以后多多支持脚本之家!

您可能感兴趣的文章:
阅读全文