目录
speechmetrics库提供了对语音质量进行评估的各种指标,包括MOSNet、BSSEval、STOI、PESQ、SRMR、SISDR等,方便我们对模型进行快速评估。
github链接在这里。
由于 pip install git+http://......
会出现一些问题,再加上国内的种♂种♂原♂因,用speechmetrics官方提供的安装方式无法成功安装。
亲测有效的安装方式如下:
如果下载速度慢的话可以考虑使用魔♂法。
将21~24行的https改为git
进入工程目录,直接使用如下命令进行安装
pip install ./
安装过程中会下载一大堆依赖库,首次下载会花费相对较长的时间,耐心等待即可 (或者使用魔♂法)。
测试代码如下
import speechmetrics
#定义窗长,每多少秒评价一次,None则对完整音频进行评价
window_length = None # seconds
#加载metric,在这里定义需要评价的指标
metrics = speechmetrics.load(['pesq', 'stoi', 'sisdr'], window_length)
#对音频进行评价
score = metrics("./DCCRN-C.wav", "./0-clean.wav") #params: denoised.wav, clean.wav
print(score)
'''
{'nb_pesq': 2.7491965293884277,
'pesq': 1.773357629776001,
'sisdr': 8.636653915700691,
'stoi': 0.9070218637754633}
'''
用DCCRN官方公布的测试音频(simulated WSJ0 and MUSAN data中0db音频的DCCRN-C效果)进行测试,可以看到窄带PESQ的值跟DCCRN论文中的值还是比较接近的。
手机扫一扫
移动阅读更方便
你可能感兴趣的文章