声纹识别技术简介 声纹识别,也称作说话人识别,是一种通过声音判别说话人身份的技术。从直觉上来说,声纹虽然不像人脸、指纹的个体差异那样直观可见,但由于每个人的声道、口腔和鼻腔也具有个体的差异性,因此反映到声音上也具有差异性。如果说将口腔看作声音的发射器,那作为接收器的人耳生来也具备辨别声音的能力。 最 ...
分类:
其他好文 时间:
2019-02-26 15:26:34
阅读次数:
172
说话人识别(Speaker Recognition,SR),又称声纹识别(Voiceprint Recognition,VPR),顾名思义,即通过声音来识别出来“谁在说话”。语音识别(Automatic Speech Recognition,ASR)是通过声音识别出来“在说什么”。为了区分,本文的主 ...
分类:
其他好文 时间:
2018-07-26 00:22:04
阅读次数:
234
azure说话人识别API 官方文档:https://westus.dev.cognitive.microsoft.com/docs/services/563309b6778daf02acc0a508/operations/5645c523778daf217c292592 官方Python SDK: ...
作者:桂。 时间:2017-05-31 21:14:56 链接:http://www.cnblogs.com/xingshansi/p/6925955.html 前言 VQ(Vector Quantization)是一个常用的压缩技术,本文主要回顾: 1)VQ原理 2)基于VQ的说话人识别(SR,s ...
分类:
其他好文 时间:
2017-06-01 00:37:06
阅读次数:
280
所谓的语音信号分析就是提取表征语音特征的信息,以进行后续的处理:语音识别、说话人识别等。语音特征信息及特征参数的提取。由于语音信号具有短时平稳特性,及在短时内特征参数稳定不变,一般时长为10~30ms,故通常将语音分帧处理,以获得稳定的特征参数。综上,对于一段语音信号,分析时通常表示为由每一帧特征参...
分类:
其他好文 时间:
2015-10-15 20:40:33
阅读次数:
247
支持向量机是一种非常流行的监督学习的算法 简称SVM 针对线性和非线性的数据 它是利用一种非线性转换,将原始训练数据映射到高维空间上。目前已经在手写数字识别 对象识别 说话人识别 以及基准时间序列预测检验等方面得到了广泛的应用SVM的目标是寻求一个超平面, 关心的是让离超平面最近的点能够具有最大的间...
分类:
其他好文 时间:
2015-10-06 16:36:13
阅读次数:
177
之前我写过《我对说话人识别/声纹识别的研究综述》,本篇基本上可以是这个综述的续写。其实,写的也没有什么深度,想获得深度信息的朋友们可以不用往下看了,还不如下载几篇领域内的国内博士论文看看。为什么是国内呢?因为国内博士论文前面的综述写的还不错,嘿嘿~我写这个主要是给不熟悉这个领域内的朋友看的,用通熟的话描述这个领域内重要的一些算法,等于是入个门吧。PLDA算法前面博客已经提到过声纹识别的信道补偿算法,...
分类:
编程语言 时间:
2015-08-05 10:33:49
阅读次数:
267
GMM-UBM系统框架
GMM-UBM的核心思想是用混合高斯函数去拟合特征在高维空间的概率密度分布,在训练说话人模型的时候,由于注册时说话人的数据稀疏,通常利用一个通用背景模型(Universal Background Model,UBM)和少量的说话人数据,通过自适应算法(如最大后验概率MAP,最大似然线性回归MLLR等)得到目标说话人模型;在测试时,用测试语音相对于目标说话人模型和UBM模型...
分类:
其他好文 时间:
2015-08-03 21:00:17
阅读次数:
409