PCA对手写数字数据集的降维 还记得我们上一周在讲特征工程时,使用的手写数字的数据集吗?数据集结构为(42000, 784),用KNN跑一次半小时,得到准确率在96.6%上下,用随机森林跑一次12秒,准确率在93.8%,虽然KNN效果好,但由于数据量太大,KNN计算太缓慢,所以我们不得不选用随机森林 ...
分类:
编程语言 时间:
2021-06-28 18:03:47
阅读次数:
0
1 PCA参数列表 2 PCA属性列表 3 PCA接口列表 ...
分类:
编程语言 时间:
2021-06-28 18:03:27
阅读次数:
0
上示例: 谷歌浏览器 from selenium import webdriverfrom selenium.webdriver.chrome.options import Optionsoptions = Options()options.headless = Truedriver = webdr ...
分类:
编程语言 时间:
2021-06-28 18:03:12
阅读次数:
0
Python爬取近十年中国电影票房数据与分析 一、选题背景 Q:为什么选择选择此题? 随着网络的迅速发展,万维网成为大量信息的载体,如何有效地提取并利用这些信息成为一个巨大的挑战。 Q:达到什么预期目标? 爬取中国近10年的电影票房,并数据可视化。 Q:项目背景 “2013年受市场热捧的电影行业其实 ...
分类:
编程语言 时间:
2021-06-28 18:01:54
阅读次数:
0
一、简介 1 概述 在计算机视觉和图像处理领域,最大类间方差法(otsu)又叫做大津法,是1979年由日本学者大津提出的,是一种自适应阈值分割方法,减少灰阶图像等级成为一个二值图像。该算法假定图像分为两类(符合双峰直方图分布,两类分别称为前景/目标像素和背景像素),然后计算出一个最优的阈值将将此图像 ...
分类:
其他好文 时间:
2021-06-28 18:00:29
阅读次数:
0
Sampling + Randomized Sampling + Weighted Sampling + Priority Sampling ...
分类:
编程语言 时间:
2021-06-28 17:51:24
阅读次数:
0
做了zip压缩的功能后,突然对背后的原理和算法想了解下,于是学习总结如下: 具体的算法,可以先忽略,把每种算法的原理以及基本的数学知识先了解一遍,有兴趣的话,然后对每一种算法再详细学习和了解,甚至用程序去实现。 MD5 加密原理:以512位分组来处理输入的信息,且每一分组又被划分为16个32位子分组 ...
分类:
编程语言 时间:
2021-06-28 17:46:29
阅读次数:
0
加入: import pylab pylab.rcParams['font.sans-serif'] = ['SimHei'] pylab.rcParams['font.sans-serif'] = ['Microsoft YaHei'] pylab.rcParams['axes.unicode_m ...
分类:
编程语言 时间:
2021-06-28 17:44:52
阅读次数:
0
LVS原理与实现 - 原理篇 LVS,全称 Linux Virtual Server,是章文嵩博士发起的一个开源项目。在社区具有很大的热度,是一个基于四层、性能极高的反向代理服务器。至于什么是反向代理,这里就不作详细介绍了,如果不了解可以先去阅读反向代理相关的资料。 LVS工作原理 下面先介绍一下 ...
分类:
其他好文 时间:
2021-06-28 17:43:07
阅读次数:
0
假设你是一位很棒的家长,想要给你的孩子们一些小饼干。但是,每个孩子最多只能给一块饼干。
对每个孩子 i,都有一个胃口值 g[i],这是能让孩子们满足胃口的饼干的最小尺寸;并且每块饼干 j,都有一个尺寸 s[j] 。如果 s[j] >= g[i],我们可以将这个饼干 j 分配给孩子 i ,这个孩子会得... ...
分类:
编程语言 时间:
2021-06-28 17:39:25
阅读次数:
0