首页 > 脚本专栏 > python > jieba.cut与jieba.lcut的区别

关于jieba.cut与jieba.lcut的区别及说明

2023-05-06 09:53:44 作者：stay_foolish12

这篇文章主要介绍了关于jieba.cut与jieba.lcut的区别及说明，具有很好的参考价值，希望对大家有所帮助。如有错误或未考虑完全的地方，望不吝赐教

jieba.cut与jieba.lcut的区别

jieba.cut生成的是一个生成器，generator，也就是可以通过for循环来取里面的每一个词。

word_list= [word for word in jieba.cut(text)]

jieba.lcut 直接生成的就是一个list

Prefix dict has been built succesfully.
Full Model 我/来/北京/上学
['我', '来', '北京', '上学']

jieba的几个分词接口：cut、lcut、posseg.cut、posseg.lcut

cut

cut提供最基本的分词功能，返回的结果是个生成器generator，可通过迭代的方法访问各个分词

lcut

lcut和cut方法的区别是：lcut返回的是list。也可以通过list(jieba.cut()) 来等价jieba.lcut()

prosseg的方法

posseg.cut 和 posseg.lcut的区别雷同，只不过posseg还提供了词性，方便对句法做分析

s = '我们都是小青蛙 呱呱呱呱 喜欢快乐的生活 还会讲笑话'
import jieba
jieba.cut(s)  # <generator object cut at 0x10a6e5500>
list(jieba.cut(s))  # [u'\u6211\u4eec', u'\u90fd', u'\u662f',...]
jieba.lcut(s)  # [u'\u6211\u4eec', u'\u90fd', u'\u662f',...]
import jieba.posseg
jieba.posseg.cut(s)  # <generator object cut at 0x10cc80eb0>
list(jieba.posseg.cut(s))  # [pair(u'\u6211\u4eec', u'r'), pair(u'\u90fd', u'd')...]
jieba.posseg.lcut(s)  # [pair(u'\u6211\u4eec', u'r'), pair(u'\u90fd', u'd')...]

总结

以上为个人经验，希望能给大家一个参考，也希望大家多多支持脚本之家。

关于jieba.cut与jieba.lcut的区别及说明

jieba.cut与jieba.lcut的区别

jieba的几个分词接口：cut、lcut、posseg.cut、posseg.lcut

总结

您可能感兴趣的文章: