python

关注公众号 jb51net

关闭
首页 > 脚本专栏 > python > Python Pydub处理音频

Python使用Pydub处理音频的方法详解

作者:sitellla

Pydub 是一个简洁高效的 Python 音频处理库,支持 MP3、WAV 等多种格式,它提供了直观的链式调用 API,可实现音频切片、音量调节、拼接、淡入淡出等操作,本文给大家介绍了Python使用Pydub处理音频的方法,需要的朋友可以参考下

Pydub 在 GitHub 上已经拿到 9,763 个 Star。

这个 Python 库的目标是让音频操作变得简单直观。打开文件、剪片段、调音量、拼接、淡入淡出、格式转换,全部链式调用,几行代码写完。

1、 核心能力

打开音频文件:

from pydub import AudioSegment
song = AudioSegment.from_wav("file.wav")
song = AudioSegment.from_mp3("file.mp3")

MP3、WAV、Ogg、FLV、MP4,只要 ffmpeg 支持的格式,它都认识。统一用 AudioSegment 对象,不用为每种格式写不同的解析逻辑。

切片基于毫秒:

first_10_seconds = song[:10000]
last_5_seconds = song[-5000:]

调音量直接用加减运算符:

louder = first_10_seconds + 6
quieter = last_5_seconds - 3

拼接和重复:

mix = beginning + end
loop = mix * 2

2、 链式调用

因为每个操作都返回新的 AudioSegment,可以一口气串起来:

result = (song[:10000] + 6)
    .append(song[-5000:] - 3, crossfade=1500)
    .fade_in(2000)
    .fade_out(3000)
result.export("output.mp3", format="mp3", bitrate="192k")

不用手动算帧率,不用管采样率,不用写循环。AudioSegment 是不可变对象,所有操作不修改原数据。

导出时支持更多参数,直接透传给 ffmpeg:

song.export("output.mp3", format="mp3",
    parameters=["-ac", "2", "-vol", "150"],
    tags={"artist": "Pydub", "album": "Demo"})

3、 调试

转换出错时可以打开日志,查看实际执行的 ffmpeg 命令:

import logging
l = logging.getLogger("pydub.converter")
l.setLevel(logging.DEBUG)
l.addHandler(logging.StreamHandler())

大多数转换问题来自 ffmpeg 环境配置,日志能直接暴露是哪一步出了问题。

4、 安装

pip install pydub

然后装 ffmpeg。macOS 用 brew install ffmpeg,Linux 用 apt-get install ffmpeg,Windows 下载二进制文件加到 PATH 就行。

5、 实际场景

批量转视频为音频:

import glob
from pydub import AudioSegment

for video in glob.glob("*.mp4"):
    mp3 = video.replace(".mp4", ".mp3")
    AudioSegment.from_file(video).export(mp3, format="mp3")

拼接歌单,带交叉淡化:

playlist = None
for mp3_file in glob("*.mp3"):
    song = AudioSegment.from_mp3(mp3_file)
    if playlist is None:
        playlist = song[:30000]
    else:
        playlist = playlist.append(song, crossfade=10000)
playlist.fade_out(30000).export("mix.mp3", format="mp3")

6、 适合谁

处理音频批量的开发者、做播客剪辑工具的、跑语音识别预处理的、需要在 Python 项目里加音效播放的。API 足够直观,看过 Quickstart 就能上手。

项目基于 MIT 协议,由 James Robert 在 2011 年发布,社区活跃,问题可以在 Stack Overflow 上找到解答。

thon 项目里加音效播放的。API 足够直观,看过 Quickstart 就能上手。

项目基于 MIT 协议,由 James Robert 在 2011 年发布,社区活跃,问题可以在 Stack Overflow 上找到解答。

以上就是Python使用Pydub处理音频的方法详解的详细内容,更多关于Python Pydub处理音频的资料请关注脚本之家其它相关文章!

您可能感兴趣的文章:
阅读全文