密度聚类(Density-based Clustering)假设聚类结构能够通过样本分布的紧密程度来确定。DBSCAN是常用的密度聚类算法,它通过一组邻域参数(??,MinPtsMinPts)来描述样本分布的紧密程度。给定数据集DD={x? 1,x? 2,x? 3,...,x? Nx→1,x→2,x ...
分类:
数据库 时间:
2018-07-01 20:56:25
阅读次数:
219
原项目地址:SSD-Tensorflow 根据README的介绍,该项目收到了tf-slim项目中包含了多种经典网络结构(分类用)的启发,使用了模块化的编程思想,可以替换检查网络的结构,其模块组织如下: datasets: 数据及接口,interface to popular datasets (P ...
分类:
其他好文 时间:
2018-06-30 20:22:12
阅读次数:
583
import tensorflow as tf import numpy as np import matplotlib.pyplot as plt from sklearn import datasets import random from PIL import Image from tenso... ...
分类:
其他好文 时间:
2018-06-29 11:10:38
阅读次数:
178
torch.utils.data.DataLoader 参数介绍: 1、dataset,这个就是PyTorch已有的数据读取接口(比如torchvision.datasets.ImageFolder)或者自定义的数据接口的输出,该输出要么是torch.utils.data.Dataset类的对象,要 ...
分类:
其他好文 时间:
2018-06-28 10:56:56
阅读次数:
5670
import mglearn from sklearn.datasets import make_blobs import matplotlib.pyplot as plt import numpy as np from sklearn.svm import LinearSVC X,Y=make_b... ...
分类:
其他好文 时间:
2018-06-26 13:18:15
阅读次数:
853
数据集原数据来源:http://archive.ics.uci.edu/ml/datasets/Pen-Based+Recognition+of+Handwritten+Digits 数据集简介:这个数据集一共有1797张手写数字,每张手写数字的大小都为8*8像素在sklearn中,被保存为一个nu ...
分类:
其他好文 时间:
2018-06-24 00:45:14
阅读次数:
941
SparkSQL数据源:从各种数据源创建DataFrame 因为 spark sql,dataframe,datasets 都是共用 spark sql 这个库的,三者共享同样的代码优化,生成以及执行流程,所以 sql,dataframe,datasets 的入口都是 sqlContext。 可用于 ...
分类:
数据库 时间:
2018-06-15 20:06:26
阅读次数:
189
import tensorflow as tf import numpy as np import matplotlib.pyplot as plt from sklearn import datasets sess=tf.Session() #加载鸢尾花集 iris=datasets.load_i... ...
分类:
编程语言 时间:
2018-06-12 00:45:15
阅读次数:
245
#coding:utf-8from sklearn.datasets import load_irisfrom sklearn.model_selection import train_test_splitfrom sklearn.neighbors import KNeighborsClassif... ...
分类:
编程语言 时间:
2018-06-11 15:48:05
阅读次数:
675
RDD 介绍 RDD,全称Resilient Distributed Datasets(弹性分布式数据集),是Spark最为核心的概念,是Spark对数据的抽象。RDD是分布式的元素集合,每个RDD只支持读操作,且每个RDD都被分为多个分区存储到集群的不同节点上。除此之外,RDD还允许用户显示的指定 ...
分类:
编程语言 时间:
2018-06-07 20:46:38
阅读次数:
334