无监督学习的目标: 利用无标签的数据学习数据的分部或数据与数据之间的关系被称作无监督学习。 无监督学习最常应用的场景是聚类和降维。 聚类 (sklearn.cluster模块) 定义 聚类(clustering),就是根据数据的“相似性”将数据分为多类的过程。 评估两个不同样本之间的“相似性” ,通 ...
分类:
其他好文 时间:
2020-02-02 21:52:21
阅读次数:
120
Scikit-learn Scikit-learn是Python中开发和实践机器学习的类库之一,依赖于Scipy及其相关类库来运行。 Scikit-learn的基本功能主要分为六大类:分类,回归,聚类,数据降维,模型选择,数据处理。需要指出的是,由于Scikit-learn本身不支持深度学习,也不支 ...
分类:
系统相关 时间:
2020-02-01 13:00:26
阅读次数:
84
1. 你一定要看计算机领域的文章. 如果你是看一堆应用,你最终还是会不知道怎么做. 从计算机到energy是降维打击, 当你学习了计算机的hot skill,再去做应用很容易. 2. 搞研究的思路: 大量阅读文章,然后形成思路,然后justify每一步的合理性和可行性. 你需要critical th ...
分类:
其他好文 时间:
2020-01-21 21:33:17
阅读次数:
80
引言 这段时间来,看了西瓜书、蓝皮书,各种机器学习算法都有所了解,但在实践方面却缺乏相应的锻炼。于是我决定通过Kaggle这个平台来提升一下自己的应用能力,培养自己的数据分析能力。 我个人的计划是先从简单的数据集入手如手写数字识别、泰坦尼克号、房价预测,这些目前已经有丰富且成熟的方案可以参考,之后关 ...
分类:
其他好文 时间:
2020-01-21 16:00:38
阅读次数:
106
任务流程: 1.读取图片文件 2.用knn识别图片文件并用k折交叉验证调参 3.用PCA对文件降维,用knn识别文件 4.抽取图片特征然后交给knn训练 一、文件的读取、可视化、以及采样 数据的初始化及其读取: from load_data import load_CIFAR10 import nu ...
分类:
其他好文 时间:
2020-01-19 00:03:13
阅读次数:
108
池化的概念是在 AlexNet 网络中提出的,之前叫做降采样; 池化到底在做什么,不多解释; 池化的作用 首先需要明确一下池化发生在哪里:卷积后经过激活函数形成了 feature map,即 Relu(wx + b) ,后面接池化层 1. 池化可以形象化的理解为降维 2. 池化避免了局部位移或者微小 ...
分类:
其他好文 时间:
2020-01-18 12:44:06
阅读次数:
108
壹 ? 引 JavaScript开发中数组加工极为常见,其次在面试中被问及的概率也特别高,一直想整理一篇关于数组常见操作的文章,本文也算了却心愿了。 说在前面,文中的实现并非最佳,实现虽然有很多种,但我觉得大家至少应该掌握一种,这样在面试能解决大部分数组问题。在了解实现思路后,日常开发中结合实际场景 ...
分类:
编程语言 时间:
2020-01-18 00:57:29
阅读次数:
68
任务目的: 知道图像的表示以及读取方法 了解图像的特征 对图像特征进行降维 一、图像的读取及表示 图像要进行处理才能进行模型输入。 python自带的库将图像存在矩阵或者张量里面。 图像由像素组成,一个像素点一般油RGB三维数组构成。 二、图像的特征 图像的识别should环境因素约束。 常见的图像 ...
分类:
其他好文 时间:
2020-01-17 21:29:41
阅读次数:
119
目的 和转录组或蛋白组的分析原理类似,目的是: 将大量的差异代谢物降维到少量的显著富集的代谢通路,方便解释科学问题; 从通路水平上可以更好解释表型背后的生物学原理/过程。 富集分析方法 富集分析的本质:某个代谢通路在不同的状态下(如疾病与健康)是否发生了显著变化? ORA富集 回答的问题:一个代谢物 ...
分类:
其他好文 时间:
2020-01-15 22:56:58
阅读次数:
412
解决分类问题 天然可以解决多分类问题 思想简单,效果强大 使用k近邻算法解决回归问题 KNeighborsRegressor 缺点2:高度数据相关 缺点3:预测的结果不具有可解释性 缺点4:维数灾难 随着维度的增加,‘看似相近’的的两个点之间的距离越来越大 解决方法:降维(PCA) ...
分类:
编程语言 时间:
2020-01-15 21:25:12
阅读次数:
73