Pandas详解 Pandas是一个强大的分析结构化数据的工具集;它的使用基础是Numpy(提供高性能的矩阵运算);用于数据挖掘和数据分析,同时也提供数据清洗功能。 1、安装包 pip install pandas 2、数据结构 Pandas有三大数据结构,Series、DataFrame以及Pan ...
分类:
其他好文 时间:
2020-05-09 00:32:44
阅读次数:
78
链接:https://pan.baidu.com/s/1_ytY_EEBzb3uqmtcl1Ku1Q 提取码:97em 这本书是我研一学习数据挖掘课程的教材,很经典,书也比较厚,讲的比较透彻 链接:https://pan.baidu.com/s/1_ytY_EEBzb3uqmtcl1Ku1Q 提取码 ...
分类:
其他好文 时间:
2020-05-09 00:27:53
阅读次数:
84
许多人听说过无纸,但他们对无纸的具体情况和特点不是很熟悉。paperisok编辑了一篇文章来帮助人们更好地理解什么是无纸。那么paperfree查重靠谱吗? 什么是无纸? 本发明在对学生提交的论文的所有指纹特征进行预处理的情况下,采用多级指纹比对技术和深度语义挖掘识别比对技术相结合,利用指纹索引快速准确地找到云检测服务部署建立的不断增长的论文数据资源库中的所有相似片段。帮助高校检测和比较学
分类:
其他好文 时间:
2020-05-08 10:00:44
阅读次数:
71
1.1 协同过滤算法介绍 1.什么是协同过滤算法 1. 协同过滤推荐算法是诞生最早,并且较为著名的推荐算法,主要的功能是预测和推荐。 2. 算法通过对用户历史行为数据的挖掘发现用户的偏好,基于不同的偏好对用户进行群组划分并推荐品味相似的商品。 3. 协同过滤推荐算法分为两类,分别是基于用户的协同过滤 ...
分类:
编程语言 时间:
2020-05-07 15:28:42
阅读次数:
96
1 背景 用户本地有一份txt或者csv文件,无论是从业务数据库导出、还是其他途径获取,当需要使用蚂蚁的大数据分析工具进行数据加工、挖掘和共创应用的时候,首先要将本地文件上传至ODPS,普通的小文件通过浏览器上传至服务器,做一层中转便可以实现,但当这份文件非常大到了10GB级别,我们就需要思考另一种 ...
分类:
编程语言 时间:
2020-05-06 18:02:50
阅读次数:
116
redash可以作为可视化工具、数据库查询编辑器(类似navicat-premium)、数据挖掘探索工具来用。截止目前,自建redash支持43种数据源,在权限控制,精细配图方面比superset弱,但是环境易维护,可以生成中间表,可以join。 权限管理 https://ithelp.ithome ...
分类:
其他好文 时间:
2020-05-06 14:16:51
阅读次数:
233
实践内容 一个主动攻击实践,如ms08_067 攻击机:Linux kali 4.19.0 kali1 amd64 ip:192.168.160.150(NAT) 靶机:metasploitable linux 2.0.0 ip:192.168.160.151(NAT) 利用漏洞:UnreallRC ...
分类:
其他好文 时间:
2020-05-03 23:06:06
阅读次数:
135
数据预处理的主要内容包括数据清洗、数据集成、数据变换、数据规约。 数据清洗主要是删除原始数据集中的无关数据、重复数据,平滑噪声数据,筛选掉与挖掘主题无关的数据,处理缺失值和异常值。 数据质量分析是检查数据中是否存在一些脏数据,例如:缺失值、异常值和不一致的值等。 数据缺失有很多原因,例如数据无法获得 ...
分类:
其他好文 时间:
2020-05-03 16:39:32
阅读次数:
136
"Link" 题目大意:给定$n$个二元组,每次可以选择一组,花费是组内最大的长乘以最大的宽。问消掉所有二元组的最小代价。 $\text{Solution:}$ $dp$写的不够啊…… 先挖掘一下题目性质,对于一个二元组,如果它的长和宽都可以被某一个二元组覆盖掉,则它显然是可以被并掉的,于是我们去掉 ...
分类:
其他好文 时间:
2020-05-03 01:03:44
阅读次数:
46
数据采集利用各种手段获取数据,数据样式不限制,但一般而言是形如excel或者csv这样的表格格式。数据采集:urllib,requests数据解析:Xpath,BS4,正则表达式数据持久化存储:pd.to_csv,pd.to_excel,MySQL,Redis数据预处理一般而言,数据分析和数据挖掘领域的处理的数据都是海量的数据,这样的数据难免会出现问题。数据预处理占到数据挖掘工作的60%,这是最重
分类:
编程语言 时间:
2020-05-03 00:58:59
阅读次数:
67