安装 略。 转码 最简单命令如下: 后面是输入文件名。 后面是编码格式,h264 最佳,但 Windows 系统默认不安装。如果是要插入 ppt 的视频,选择 wmv1 或 wmv2 基本上万无一失。 附加选项: 指定帧率, 指定分辨率, 指定比特率;于此同时可以对声道进行转码, 指定音频编码, 指 ...
分类:
其他好文 时间:
2020-01-08 19:20:07
阅读次数:
152
音乐研究 时间限制:C/C++ 1秒,其他语言2秒 空间限制:C/C++ 32M,其他语言64M 美团外卖的品牌代言人袋鼠先生最近正在进行音乐研究。他有两段音频,每段音频是一个表示音高的序列。现在袋鼠先生想要在第二段音频中找出与第一段音频最相近的部分。具体地说,就是在第二段音频中找到一个长度和第一段 ...
分类:
其他好文 时间:
2020-01-08 13:04:11
阅读次数:
96
恢复内容开始 一。二进制安全 数据写入时是什么样子,读出来就是什么样子,这称为二进制安全。 c语言的字符串不是二进制安全的,以\0为结束符,只能存储文本数据,不能存储图片音频等二进制数据。 举例 string.c 文件 运行后得出如下结果, a和b是相等的,长度是3,而显然a和b是不想等的,长度也应 ...
分类:
其他好文 时间:
2020-01-07 22:59:16
阅读次数:
153
刚学习 FFmpeg,用于测试需要各种视频格式文件,例如 RGB、YUV 和 H264 文件等等,所以去网上找这些资源下载,要么难以找到,要么就需要积分。后来才想到可以使用 FFmpeg 命令来转换获得这些文件,成功转换获得了这些文件(也可以编写程序实现)。顺便参考网上资料总结出了这篇博文,后续也会 ...
分类:
其他好文 时间:
2020-01-07 20:02:50
阅读次数:
110
背景 + 刚从B站上看过倒放挑战之后也想体验下,心血来潮一个晚上完成了基本的实现。其中倒放与播放部分使用了pydub这个音频库,十分快捷方便,但是它完整一套的配置让我还是踩了几个坑。特将其配置过程记录于此,方便大家。 + 系统 + " " 安装 + :打开 ,`activate pip instal ...
分类:
编程语言 时间:
2020-01-05 00:01:26
阅读次数:
477
简称SD,顾名思义,在采集的语音信号流中,分辨出不同说话人的说话时长并标注。参照2010年8月的文献[1]中的一张图: 又称说话人分割,在语音信号处理的多种场景下均有应用需求,近年来也被多来越多的研究者所关注。SD的方法分为以下两种:1)无监督方法,比如谱聚类以及k均值等;2)监督方法,深度神经网络 ...
分类:
其他好文 时间:
2020-01-04 20:09:39
阅读次数:
582
一、名词解析 PCM(Pulse Code Modulation)也被称为脉码编码调制,PCM中的声音数据没有被压缩,它是由模拟信号经过采样、量化、编码转换成的标准的数字音频数据。采样转换方式参考下图进行了解: 音频采样包含以下几大要素: 1. 采样率 采样率表示音频信号每秒的数字快照数。该速率决定 ...
分类:
其他好文 时间:
2020-01-04 14:15:19
阅读次数:
109
智能家居行业是AI在生活服务领域的重要落地场景,也是我们感知AI落地最深的行业之一。智能家居产品融合语音控制、物联网技术,让我们生活更智能、给生活带来更多便利,目前主要应用场景如智能音箱、扫地机器人、智能电视等。 1.智能家居数据采集 覆盖智能家居主流应用场景,支持专业音频设备与多条件场景,交付能力 ...
分类:
其他好文 时间:
2020-01-03 12:45:47
阅读次数:
219
在我以前的实际项目中,曾利用 libvlc 去解码音视频媒体数据(如 RTSP、本地文件 等),通过其提供的回调函数接口,攫取 RGB图像 进行图像分析,如 人脸识别、运动检测 等一类的产品应用。除此之外,只要提供适当的 "MRL" ,配合选项参数,VLC 还可以进行屏幕录制、摄像头图像采集、麦克风 ...
分类:
编程语言 时间:
2020-01-01 23:46:01
阅读次数:
126
* 二维码容量有多大?
* 二维码上面三个大方块是干什么的?
* 二维码能存储视频/音频吗?
* 二维码破损了为什么还能被识别?
* 二维码生成原理是怎样的? ...
分类:
其他好文 时间:
2020-01-01 18:38:22
阅读次数:
94