python

关注公众号 jb51net

关闭
首页 > 脚本专栏 > python > python获取英文文本句子单词音素

python使用phonemizer实现获取英文文本句子单词音素

作者:DataBall

这篇文章主要为大家详细介绍了python如何使用phonemizer实现获取英文文本句子单词音素,文中的示例代码讲解详细,感兴趣的小伙伴可以跟随小编一起了解下

使用 phonemizer 获取英文文本句子单词音素。

安装 phonemizer 库。

pip install phonemizer

具体代码实现如下:

# -*-coding:utf-8-*-
# date:2024-11
# Author: DataBall - XIAN
# Function: 获取英文文本句子单词音素
from phonemizer import phonemize
from phonemizer.backend import EspeakBackend
from phonemizer.punctuation import Punctuation
from phonemizer.separator import Separator
 
# en-gb – 英国英语
# en-us – 美国英语
 
language_ = "en-us" # 语言
 
print("语言类型 :{}".format(language_))
backend = EspeakBackend(language_)
print("\n-------------------------------->>")
text = "hello Tom , my name is Lily  !"
# 整句音素
phonemes = phonemize(text, language=language_, backend='espeak', strip=True)
print("整句文本: {}: ".format(text))
print("整句音素:{}".format(phonemes))
 
print("\n-------------------------------->>")
# 按词分割音素
words = [word for word in text.lower().split(' ')]
# 音素之间用空格分割
phonemes_word = Separator(phone=' ', word=None)
dict_ = {word: backend.phonemize([word], separator=phonemes_word, strip=True)[0] for word in words}
 
print("打印音素字典:")
i = 0
for key_ in dict_.keys():
    i += 1
    if len(dict_[key_])>0: # 去除标点符号干扰
        print(" [{}] {} : {}".format(i,key_,dict_[key_]))

选择语言”en-us“执行log如下:

语言类型 :en-us
 
-------------------------------->>
整句文本: hello Tom , my name is Lily  !:
整句音素:həloʊ tɑːm maɪ neɪm ɪz lɪli
 
-------------------------------->>
打印音素字典:
 [1] hello : h ə l oʊ
 [2] tom : t ɑː m
 [4] my : m aɪ
 [5] name : n eɪ m
 [6] is : ɪ z
 [7] lily : l ɪ l i

选择语言”en-gb“执行log如下:

语言类型 :en-gb
 
-------------------------------->>
整句文本: hello Tom , my name is Lily  !:
整句音素:hələʊ tɒm maɪ neɪm ɪz lɪli
 
-------------------------------->>
打印音素字典:
 [1] hello : h ə l əʊ
 [2] tom : t ɒ m
 [4] my : m aɪ
 [5] name : n eɪ m
 [6] is : ɪ z
 [7] lily : l ɪ l i

到此这篇关于python使用phonemizer实现获取英文文本句子单词音素的文章就介绍到这了,更多相关python获取英文文本句子单词音素内容请搜索脚本之家以前的文章或继续浏览下面的相关文章希望大家以后多多支持脚本之家!

您可能感兴趣的文章:
阅读全文