【KAWAKO】speechmetrics-语音方面评价指标库的安装与使用
阅读原文时间:2023年07月11日阅读:2

目录

speechmetrics库提供了对语音质量进行评估的各种指标,包括MOSNet、BSSEval、STOI、PESQ、SRMR、SISDR等,方便我们对模型进行快速评估。

github链接在这里

由于 pip install git+http://...... 会出现一些问题,再加上国内的种♂种♂原♂因,用speechmetrics官方提供的安装方式无法成功安装。

亲测有效的安装方式如下:

将工程以压缩包形式下载到本地

如果下载速度慢的话可以考虑使用魔♂法。

把压缩包传到服务器(你想部署的地方)上进行解压

用编辑器打开setup.py进行修改

将21~24行的https改为git

在工程目录下进行安装

进入工程目录,直接使用如下命令进行安装

pip install ./

安装过程中会下载一大堆依赖库,首次下载会花费相对较长的时间,耐心等待即可 (或者使用魔♂法)。

测试代码如下

import speechmetrics

#定义窗长,每多少秒评价一次,None则对完整音频进行评价
window_length = None # seconds

#加载metric,在这里定义需要评价的指标
metrics = speechmetrics.load(['pesq', 'stoi', 'sisdr'], window_length)

#对音频进行评价
score = metrics("./DCCRN-C.wav", "./0-clean.wav") #params: denoised.wav, clean.wav
print(score)
'''
{'nb_pesq': 2.7491965293884277,
 'pesq': 1.773357629776001,
 'sisdr': 8.636653915700691,
 'stoi': 0.9070218637754633}
'''

DCCRN官方公布的测试音频(simulated WSJ0 and MUSAN data中0db音频的DCCRN-C效果)进行测试,可以看到窄带PESQ的值跟DCCRN论文中的值还是比较接近的。