码迷,mamicode.com
首页 >  
搜索关键字:音频 语音    ( 7776个结果
新派系统Web前端架构
这是一个Python学习系统,主要提供给成年人。交互方式为对话式,不过里面的对话全部是通过脚本内置好的。用户通过Enter展示下一句对话,支持语音自动朗读。 先看架构! 基础支持层 提供了课程学习回使用到的通用功能模块 图片展示系统。标准化图片展示(限制展示图片在640px*480px范围内)、点击 ...
分类:Web程序   时间:2020-09-18 17:09:59    阅读次数:49
《银河补习班》里的的完美教育理念,已经通过 AI 实现了
https://mp.weixin.qq.com/s/tOsjs6PxjBXqazleGz2nogBy超神经场景描述:暑期档电影《银河补习班》上映后,影片中父亲的教育方式引发了观众的广泛讨论。在素质教育越来越被重视的今天,我们更加注重孩子对于各类事物的亲身感受与体验,这种方式被称为沉浸式教育。如今,得益于人工智能技术的发展,沉浸式教育已经被应用在越来越多的学习场景中。关键词:沉浸式教育虚拟现实语音
分类:其他好文   时间:2020-09-18 12:10:27    阅读次数:37
谷歌的语音识别利器,最先造福了自己的员工
https://mp.weixin.qq.com/s/oswN2_hsypR1SlELVoHbegBy超神经场景描述:近日GoogleBrain团队对外发布了Parrotron项目,帮助人和设备更准确地理解具有语音障碍的人。Parrotron从音频分析入手,从语音信号的角度来解决问题。它通过单个端到端深度神经网络训练,将来自语音障碍人士的语音,直接转换为流利的合成语音,从而帮助他们解决交流上的问题
分类:其他好文   时间:2020-09-18 12:09:31    阅读次数:24
文字转语音
文字转语音 方法: function(text){ var zhText = text; zhText = encodeURI(zhText); var audio = '<audio autoplay="autoplay">' + '<source src="http://tts.baidu.co ...
分类:其他好文   时间:2020-09-18 02:54:19    阅读次数:43
数据采集,AI产业落地的“助推器”丨曼孚科技
算法、算力与数据是构成人工智能的三个基本要素。随着人工智能技术在算法与算力层面达到阶段性基本成熟,人工智能行业掀起一轮落地应用的热潮。从技术层面分析,本轮人工智能落地热潮主要集中于计算机视觉领域和语音交互领域,较为依赖机器学习领域中的深度学习方式。?目前,主流的深度学习方式以有监督学习模式为主。在该模式下,算法训练需要依靠标注数据对学习结果进行反馈,对于数据有着强依赖性需求,这也带动了AI基础数据
分类:其他好文   时间:2020-09-18 02:22:02    阅读次数:27
想让语音助手听懂方言,这个数据集或能帮你?
https://mp.weixin.qq.com/s/Ct0Vhwcc1maN1VV_pdAQUgBy超神经内容概述:方言是语音识别技术发展中必须要迈过去的坎儿,那么如何让模型能够听懂和理解方言呢?使用优质的数据集是一种的方法,本文将介绍一个经典的方言录音数据集TIMIT。关键词:语音识别方言识别数据集随着科技的成熟,语音识别技术已经走进生活的方方方面,但在方言识别和处理上却还是略显吃力。就拿美式
分类:其他好文   时间:2020-09-18 02:15:48    阅读次数:34
开发直播App对多协议编解码的支持
多协议直播接收解码:直播的基本流程都是采集→编码推流→网络分发→解码→播放。通常的视频格式:.mp4,.flv,.ogv,.webm。常见的视频封装格式:AVI,MPEG,VOB等。AVIAVI格式(后缀为.AVI):它的英文全称为AudioVideoInterleaved,即音频视频交错格式。它于1992年被Microsoft公司推出。DV-AVIDV-AVI格式(后缀为.AVI):DV的英文全
分类:移动开发   时间:2020-09-18 01:56:56    阅读次数:41
FFmpeg 开发(07):FFmpeg + OpenGLES 实现 3D 全景播放器
该文章首发于微信公众号:字节流动FFmpeg开发系列连载:FFmpeg开发(01):FFmpeg编译和集成FFmpeg开发(02):FFmpeg+ANativeWindow实现视频解码播放FFmpeg开发(03):FFmpeg+OpenSLES实现音频解码播放FFmpeg开发(04):FFmpeg+OpenGLES实现音频可视化播放FFmpeg开发(05):FFmpeg+OpenGLES实现视频解
分类:其他好文   时间:2020-09-18 00:30:52    阅读次数:32
FFmpeg 开发(03):FFmpeg + OpenSLES 实现音频解码播放
该文章首发于微信公众号:字节流动本文将利用FFmpeg对一个Mp4文件的音频流进行解码,然后使用libswresample将解码后的PCM音频数据转换为目标格式的数据,最后利用OpenSLES进行播放。FFmpeg音频解码旧文中,我们已经对视频解码流程进行了详细的介绍,一个多媒体文件(Mp4)一般包含一个音频流和一个视频流,而FFmpeg对音频流和视频流的解码流程一致。因此,本节将不再对音频解码流
分类:其他好文   时间:2020-09-17 23:46:14    阅读次数:32
FFmpeg 开发(04):FFmpeg + OpenGLES 实现音频可视化播放
该文章首发于微信公众号:字节流动FFmpeg开发系列连载:FFmpeg开发(01):FFmpeg编译和集成FFmpeg开发(02):FFmpeg+ANativeWindow实现视频解码播放FFmpeg开发(03):FFmpeg+OpenSLES实现音频解码播放本文基于上一篇文章FFmpeg+OpenSLES实现音频解码播放,利用FFmpeg对一个Mp4文件的音频流进行解码,然后将解码后的PCM音频
分类:其他好文   时间:2020-09-17 23:45:08    阅读次数:32
7776条   上一页 1 ... 13 14 15 16 17 ... 778 下一页
© 2014 mamicode.com 版权所有  联系我们:gaon5@hotmail.com
迷上了代码!