(1) FNL 数据介绍FNL((Final Operational Global Analysis)数据是美国国家环境预报中心(NECP)/美国国家大气研究中心(NCAR)提供的全球再分析资料,空间精度为1°×1°,通过FNL数据可以了解真实的全球区域气象状况。(详见https://rda.uca ...
分类:
编程语言 时间:
2019-03-27 10:51:16
阅读次数:
265
Resilient Distributed Datasets RDD本质上是一组数据的Spark表示,分布在多台机器上,使用API??让您对其进行操作。RDD可以来自任何数据源,例如文本文件,通过JDBC的数据库等。 其定义为: 弹性分布式数据集(RDD)是Spark的基本数据结构。它是一个不可变的 ...
分类:
其他好文 时间:
2019-03-25 01:01:07
阅读次数:
171
Using Siamese Networks and Pre-Trained Convolutional Neural Networks (CNNs) for Fashion Similarity Matching Resources Code for the project is availabl ...
分类:
其他好文 时间:
2019-03-14 19:49:28
阅读次数:
187
我们在机器学习中少不了对大数据的分析与处理,那么我们的数据怎么来呢?并且我们的数据是怎么训练呢? sklearn里面保存了许多的数据集 测试集与数据集的分割 from sklearn.datasets import load_iris from sklearn.model_selection imp ...
分类:
编程语言 时间:
2019-03-13 00:14:30
阅读次数:
198
dataFrames格式的数据是表格形式的,mysql数据库中的数据也是表格形式的,二者可以很方便的读取存储 安装依赖的包 pip install pandas pip install sqlalchemy pip install pymysql 使用方法 第一步:建立mysql数据库的连接 con ...
分类:
数据库 时间:
2019-03-09 20:27:21
阅读次数:
267
References : https://towardsdatascience.com/dealing-with-class-imbalanced-datasets-for-classification-2cc6fad99fd9 a.Undersampling. Say, you have 40,0... ...
分类:
其他好文 时间:
2019-02-27 21:49:17
阅读次数:
200
#简单的循环网络#-*-coding:utf-8 -*-from keras.datasets import imdbfrom keras.preprocessing import sequencemax_fetaures = 10000maxlen = 500batch_size = 32prin ...
分类:
编程语言 时间:
2019-02-25 13:16:24
阅读次数:
137
```
import numpy as np
import matplotlib.pyplot as plt
from sklearn.datasets.samples_generator import make_classification def initialize_params(dims):... ...
分类:
编程语言 时间:
2019-02-18 14:16:52
阅读次数:
191
# 打开文件path = 'D:\\操作软件\\pydata-book-2nd-edition\\pydata-book-2nd-edition\\datasets\\bitly_usagov\\example.txt'# json格式处理import jsonrecords = [json.loa ...
分类:
编程语言 时间:
2019-01-28 18:21:07
阅读次数:
154