码迷,mamicode.com
首页 > 其他好文 > 详细

numpy数据集练习

时间:2018-11-05 21:57:13      阅读:173      评论:0      收藏:0      [点我收藏+]

标签:get   形状   线图   分享   pre   查看   曲线图   数据类型   长度   

从sklearn包自带的数据集中读出鸢尾花数据集data

data=iris[‘data‘]
data

  

  运行结果

技术分享图片

查看data类型,包含哪些数据

 

from sklearn.datasets import load_iris
iris = load_iris()
iris.keys()

  

运行结果

dict_keys([‘data‘, ‘target‘, ‘target_names‘, ‘DESCR‘, ‘feature_names‘])
.取出鸢尾花特征和鸢尾花类别数据,查看其形状及数据类型
a2=iris[‘target‘]
a2

  技术分享图片

a4=iris[‘feature_names‘]
a4

  

 技术分享图片

 

取出所有花的花萼长度(cm)的数据

data=iris[‘data‘]
x=data[:,2]
x

  技术分享图片

取出某朵花的四个特征及其类别。

d=iris.data[0]
print(d)

  

[ 5.1  3.5  1.4  0.2]
生成新的数组,每个元素包含四个特征+类别
Setasa=[]
Versicolor=[]
Virginica=[]#将所有花的特征和类别分成三组,每组50个


for a in range(0,150):
    if iris.target[a]==0:
        data1=iris.data[a].tolist()
        data1.append("Setosa")
        Setasa.append(data1)
    elif iris.target[a] ==1:
        data1=iris.data[a].tolist()
        data1.append("Versicolor")
        Versicolor.append(data1)
    else:
        data1=iris.data[a].tolist()
        data1.append("Virginica")
        Virginica.append(data1)

  

生成新的数组,每个元素包含四个特征+类别
result=numpy.array([Setasa,Versicolor,Virginica])
result

  运行结果

技术分享图片

 

 计算鸢尾花花瓣长度的最大值,平均值,中值,均方差。

print("最大值:",np.max(iris.data[:,1]),
"平均值:",np.mean(iris.data[:,1]),
"中值:",np.median(iris.data[:,1]),
"均方差:",np.std(iris.data[:,1]))

  运行结果

最大值: 4.4 平均值: 3.054 中值: 3.0 均方差: 0.432146580071


显示鸢尾花某一特征的曲线图,散点图。
import matplotlib.pyplot as plt
plt.plot(iris.data[:,0],iris.data[:,1])
plt.show()

  

技术分享图片
plt.scatter(iris.data[:,0],iris.data[:,1])
plt.show()

  

技术分享图片

 

 

numpy数据集练习

标签:get   形状   线图   分享   pre   查看   曲线图   数据类型   长度   

原文地址:https://www.cnblogs.com/DSJ666/p/9911747.html

(0)
(0)
   
举报
评论 一句话评论(0
登录后才能评论!
© 2014 mamicode.com 版权所有  联系我们:gaon5@hotmail.com
迷上了代码!