1. 应用K-means算法进行图片压缩 读取一张图片 观察图片文件大小,占内存大小,图片数据结构,线性化 用kmeans对图片像素颜色进行聚类 获取每个像素的颜色类别,每个类别的颜色 压缩图片生成:以聚类中收替代原像素颜色,还原为二维 观察压缩图片的文件大小,占内存大小 # -*- coding: ...
分类:
编程语言 时间:
2020-04-19 01:20:58
阅读次数:
107
线性代数 范数 范数是一个表示向量长度大小的量函数,对于一个 N 维向量 a ,一个常见的范数函数为$l_{p}$范数 $$ l_{p}(\mathbf{a})=\lvert \lvert \mathbf{a} \rvert \rvert_{p}= (\sum_{n=1}^{N}\lvert \ma ...
分类:
其他好文 时间:
2020-04-18 23:00:40
阅读次数:
83
SciSharp Stack SciSharp STACK: "https://scisharp.github.io/SciSharp/" 基于 的开源生态系统,用于数据科学、机器学习和AI。 将所有主要的ML/AI框架从 引入 . 特点 为.NET开发者 开发者使用他们所了解和喜爱的工具可以最高效 ...
分类:
Web程序 时间:
2020-04-18 16:04:31
阅读次数:
95
对机器学习感兴趣的小伙伴,可以借助python,实现一个N-gram分词中的Unigram和Bigram分词器,来进行入门。
此项目并将前向最大切词FMM和后向最大切词的结果作为Baseline,对比分析N-gram分词器在词语切分正确率、词义消歧和新词识别等方面的优势。 ...
分类:
其他好文 时间:
2020-04-18 16:03:57
阅读次数:
123
CMOS图像传感器同时感知和处理光学图像 概述 近年来,机器视觉技术有了巨大的飞跃,现在已经成为各种智能系统的一个组成部分,包括自主车辆和机器人。通常,视觉信息由基于帧的摄像机捕获,转换成数字格式,然后使用机器学习算法(如人工神经网络(ANN)1)进行处理。然而,大量(大多是冗余)数据通过整个信号链 ...
分类:
其他好文 时间:
2020-04-18 09:44:50
阅读次数:
116
最近刚好用到距离相关的知识,于是过来回顾记录一下 ~~~ 相信大家都非常熟悉欧拉公式了,从小到大使用的最多的距离公式,比如两点之间的距离、点到直线的距离等。 如今,在机器学习等领域,还有一些其他的公式也应用的非常广,例如曼哈顿距离、余弦距离、马氏距离等。 这些距离部分直观表示如下: 其中,每个距离都 ...
分类:
其他好文 时间:
2020-04-17 20:04:50
阅读次数:
95
1. sklearn数据特征预处理 通过特定的统计方法(数学方法)将数据转换成算法要求的数据。 数值型数据:标准缩放: 归一化 标准化 类别型数据: one-hot编码 时间类型: 时间的切分 sklearn特征处理的API为:sklearn.preprocessing。 1.1 归一化 特点:通过 ...
分类:
其他好文 时间:
2020-04-17 09:20:17
阅读次数:
77
1. 机器学习的步骤 数据,模型选择,训练,测试,预测 2. 安装机器学习库sklearn pip list 查看版本 python -m pip install --upgrade pip pip install -U scikit-learn pip uninstall sklearn pip ...
分类:
编程语言 时间:
2020-04-16 16:55:07
阅读次数:
128
用朴素贝叶斯做一个分类问题,数据就用sklearn新闻数据集。 但是下载巨慢,没耐心等。接下去就是一波操作,上篮成功。 因为版本之间可能存在差异,所以就不发数据集的安装包了。 1)当你在运行程序的时候,控制台是这么输出的 Downloading 20news dataset. This may ta ...
分类:
其他好文 时间:
2020-04-16 13:09:15
阅读次数:
167
1). 扑克牌手动演练k均值聚类过程:>30张牌,3类 这里选了40张牌,随机抽取三张牌并以其各自点数作为类中心,第一次是 2 6 9 每次的分类依据就是点数离那个中心近,近就分类到该分类下。第一次分完类,在计算各分类的中心值(该类所有数字求均值),重新得出三个类中心,第二次分类如下 再重复上面的计 ...
分类:
编程语言 时间:
2020-04-16 09:16:00
阅读次数:
74