目录 一、关于Reducer全排序 1.1、 什么叫全排序 1.2、 分区的标准是什么 二、全排序的三种方式 2.1、 一个Reducer 2.2、 自定义分区函数 2.3、 采样 一、关于Reducer全排序 1.1、什么叫全排序? 在所有的分区(Reducer)中,KEY都是有序的: 正确举例: ...
分类:
编程语言 时间:
2018-05-28 10:10:14
阅读次数:
294
OpenGL ES 小结 概述 OpenGL ES (Open Graphics Library for Embedded Systems)是访问类似 iPhone 和 iPad 的现代嵌入式系统的 2D 和 3D 图形加速硬件的标准。 把程序提供的几何数据转换为屏幕上的图像的过程叫做渲染。 GPU ...
分类:
移动开发 时间:
2018-05-28 00:57:18
阅读次数:
383
总结:不平衡数据的分类,(1)数据层面:使用过采样是主流,过采样通常使用smote,或者少数使用数据复制。过采样后模型选择RF、xgboost、神经网络能够取得非常不错的效果。(2)模型层面:使用模型集成,样本不做处理,将各个模型进行特征选择、参数调优后进行集成,通常也能够取得不错的结果。(3)其他 ...
分类:
其他好文 时间:
2018-05-25 19:27:18
阅读次数:
587
先看数据: 特征如下: Time Number of seconds elapsed between each transaction (over two days) numeric V1 No description provided numeric V2 No description provi ...
分类:
其他好文 时间:
2018-05-25 14:01:19
阅读次数:
4119
与前面学习过的线性预测一样,随机过程的线性预测是用随机过程某一个采样点上的随机变量的值来预测另外一个采样点上的随机变量的值。 设想有一个离散时间的随机过程$x[n]$,并且已经得到位于采样点$n_0$上的值,现在需要我们去预测采样点$n_0+m$上的值,我们所预测的值用$\hat{x}[n_0+m] ...
分类:
其他好文 时间:
2018-05-24 18:02:50
阅读次数:
158
类别不平衡 就是指分类任务中不同类别的训练样例数目差别很大的情况 常用的做法有三种,分别是1.欠采样, 2.过采样, 3.阈值移动 由于这几天做的project的target为正值的概率不到4%,且数据量足够大,所以我采用了欠采样: 欠采样 ,即去除一些反例使得正、反例数目接近,然后再进行学习,基本 ...
分类:
其他好文 时间:
2018-05-22 22:14:03
阅读次数:
516
今天偶然帮朋友压缩一个mav格式的音频。开始用压缩码率的方式,mav格式的音频体积一点都没变,查资料需要压缩音频文件的采样率和声道才能压缩mav格式的音频。 压缩要求是:将一个mav格式的音频文件,由2.78M压缩到300kb左右,播放时间不改变。 工具:压缩工具ffmpeg)(安装方式见博客htt ...
分类:
其他好文 时间:
2018-05-22 14:49:09
阅读次数:
155
根据业务需求: 机器学习:利用计算机从历史的数据中找出规律,对未来的不确定场景做决策。全部数据,多,全面 精确 目标:人 数据分析:人 和他的知识水平对历史的数据的分析。采样数据 少 随机 误差 目标:高层 boss 机器学习细分: 人脸、指纹、语音、手势、个性医疗、助理、视频识别、自动驾驶、 深度 ...
分类:
其他好文 时间:
2018-05-17 19:16:09
阅读次数:
160
花了两天时间在前人基础上重复造了一个网页录音的轮子,顺带把github仓库使用研究了一下,扔到了github上,地址:https://github.com/xiangyuecn/Recorder 传送门:https://xiangyuecn.github.io/Recorder/ copy之前说点什 ...
分类:
微信 时间:
2018-05-17 00:02:21
阅读次数:
387
图像超分辨率重建技术就是利用一组低质量、低分辨率图像(或运动序列)来产生单幅高质量、高分辨率图像。图像超分辨率重建应用领域及其宽广,在军事,医学,公共安全,计算机视觉等方面都存在着重要的应用前景。在计算机视觉领域,图像超分辨率重建技术有可能使图像实现从检出水平(detection level)向识别 ...
分类:
其他好文 时间:
2018-05-15 16:03:06
阅读次数:
179