数据说明:MovieLens数据集,它包含来自于943个用户以及精选的1682部电影的100K个电影打分。每个用户至少为20部电影打分,数据类型user id | item id | rating | timestamp. 地址:https://grouplens.org/datasets/movi ...
分类:
编程语言 时间:
2018-04-19 18:48:45
阅读次数:
273
特征工程学习01-sklearn单机特征工程小书匠 kindle 0.数据的导入from sklearn.datasets import load_iris #导入IRIS数据集 iris=load_iris() #特征矩阵 print(iris.data[:5],len(iris.data)) #... ...
分类:
其他好文 时间:
2018-04-10 21:47:13
阅读次数:
296
1 import matplotlib.pyplot as plt 2 import numpy as np 3 4 from sklearn.datasets.samples_generator import make_blobs 5 # 生成数据 6 centers = [[-2, 2], [2 ...
分类:
编程语言 时间:
2018-04-07 16:05:13
阅读次数:
259
Tum RGB D SLAM Dataset and Benchmark https://vision.in.tum.de/data/datasets/rgbd dataset Kitti http://www.cvlibs.net/datasets/kitti/index.php ...
分类:
其他好文 时间:
2018-04-03 22:00:21
阅读次数:
162
本文翻译自 "www.tensorflow.org" 的英文教程。 模块包含一组类,可以让你轻松加载数据,操作数据并将其输入到模型中。本文通过两个简单的例子来介绍这个API 从内存中的numpy数组读取数据。 从csv文件中读取行 基本输入 对于刚开始使用 ,从数组中提取切片(slices)是最简单 ...
分类:
其他好文 时间:
2018-03-30 01:16:59
阅读次数:
654
数据说明 数据来源:http://archive.ics.uci.edu/ml/datasets/Bike+Sharing+Dataset 数据说明:仅使用day.csv文件 字段说明:Instant记录号 Dteday:日期 Season:季节 1=春天 2=夏天 3=秋天 4=冬天 yr:年份( ...
分类:
其他好文 时间:
2018-03-28 22:05:09
阅读次数:
413
数据的获取方式: 1、获取外部的公开数据集, UCI 加州大学欧文分校开放的经典数据集,被很多数据挖掘实验室采用 http://archive.ics.uci.edu/ml/datasets.html 国家数据:数据来源于中国国家统计局,包含了我国经济民生等多个方面的数据。 http://data. ...
分类:
其他好文 时间:
2018-03-09 00:26:22
阅读次数:
336
==>什么是SparkSQL?--->SparkSQL是Spark用来处理结构化数据的一个模块--->作用:提供一个编程抽象(DataFrame)并且作为分布式SQL查询引擎--->运行原理:将SparkSQL转化为RDD,然后提交到集群执行--->特点:----容易整合----统一的数据访问方式----兼容Hive----标准的数据连接----==>DataFrames组织成命名列的数据集,等同
分类:
数据库 时间:
2018-03-07 13:26:08
阅读次数:
1623
Apache Flink:十分可靠,一分不差 Apache Flink 的提出背景 我们先从较高的抽象层次上总结当前数据处理方面主要遇到的数据集类型(types of datasets)以及在处理数据时可供选择的处理模型(execution models),这两者经常被混淆,但实际上是不同的概念 数 ...
分类:
Web程序 时间:
2018-03-04 18:06:44
阅读次数:
306