码迷,mamicode.com
首页 > 编程语言 > 详细

百度语音 python

时间:2019-12-12 14:51:49      阅读:153      评论:0      收藏:0      [点我收藏+]

标签:百度   method   audio   功能   blank   setup   api   交互   www   

python实现语音识别

我们用到是百度语音识别,因为不掏钱哈哈!首先去百度官网去创建你的 APPID AK SK 这个网上很多大家没创建的自己看下

 

目前本SDK的功能同REST API,需要联网调用http接口, 具体功能见REST API 文档, REST API 仅支持整段语音识别的模式,即需要上传完整语音文件进行识别,时长不超过60s,支持、自定义词库设置, 没有其他额外功能。

原始 PCM 的录音参数必须符合 16k 采样率、16bit 位深、单声道,支持的格式有:pcm(不压缩)、wav(不压缩,pcm编码)、amr(压缩格式)

首先安装使用Python SDK有如下方式

如果已安装pip,执行pip install baidu-aip即可。

如果已安装setuptools,执行python setup.py install即可

AipSpeech是语音识别的Python SDK客户端,为使用语音识别的开发人员提供了一系列的交互方法。

参考如下代码新建一个AipSpeech

from aip import AipSpeech

 

""" 你的 APPID AK SK """

APP_ID = ‘你的 App ID‘

API_KEY = ‘你的 Api Key‘

SECRET_KEY = ‘你的 Secret Key‘

 

client = AipSpeech(APP_ID, API_KEY, SECRET_KEY)

注意:如果导报aip有问题可能是下载版本问题可以

pip uninstall baidu-aip

pip install baidu-aip

API的具体代码

# 外汇返佣

def get_file_content(filePath):

    with open(filePath, ‘rb‘) as fp:

        return fp.read()

 

# 识别本地文件

client.asr(get_file_content(‘audio.pcm‘), ‘pcm‘, 16000, {

    ‘dev_pid‘: 1536,

})

结果

// 成功返回

{

    "err_no": 0,

    "err_msg": "success.",

    "corpus_no": "15984125203285346378",

    "sn": "481D633F-73BA-726F-49EF-8659ACCC2F3D",

    "result": ["北京天气"]

}

 

// 失败返回

{

    "err_no": 2000,

    "err_msg": "data empty.",

    "sn": null

}

自己写的一段测试小代码喜欢的可以看看

from aip import AipSpeech

 

 

class BaiduVoiceToTxt(object):

    def __init__(self, client, file_path):

        self.client = client

        self.file_path = file_path

 

    # 读取文件

    @staticmethod

    def get_file_content(file_path):

        with open(file_path, ‘rb‘) as fp:

            return fp.read()

 

    # 识别本地文件

    def run(self):

        print(‘正在识别.....‘)

        result = client.asr(self.get_file_content(self.file_path), ‘pcm‘, 16000, {

            ‘dev_pid‘: 1536,

        })

 

        if not isinstance(result, dict):

            with open(‘testAudio.mp3‘, ‘wb‘) as f:

                f.write(result)

        else:

            print(‘语音内容:{}‘.format(result[‘result‘][0]))

 

 

if __name__ == ‘__main__‘:

 

    APP_ID = ‘17973848‘  # 你的 App ID‘

    API_KEY = ‘D7dskLcxcIqit6GjNxfLg3u0‘  # 你的 Api Key‘

    SECRET_KEY = ‘NbTGUrNfKWgUwGP3TFd0MCFwGi4EkRda‘  # 你的 Secret Key‘

    client = AipSpeech(APP_ID, API_KEY, SECRET_KEY)

    file_path = ‘D:\code\zuj_jian/test.pcm‘

 

    baidu_voice_to_srt_obj = BaiduVoiceToTxt(client,file_path)

    baidu_voice_to_srt_obj.run()

原文链接:https://blog.csdn.net/jianghao_boke/article/details/103461855

百度语音 python

标签:百度   method   audio   功能   blank   setup   api   交互   www   

原文地址:https://www.cnblogs.com/benming/p/12028830.html

(0)
(0)
   
举报
评论 一句话评论(0
登录后才能评论!
© 2014 mamicode.com 版权所有  联系我们:gaon5@hotmail.com
迷上了代码!