码迷,mamicode.com
首页 > 其他好文 > 详细

数据基础学习之一

时间:2020-09-17 13:45:35      阅读:21      评论:0      收藏:0      [点我收藏+]

标签:位置   ret   提高   www   增加   不同   方式   loading   alt   

什么是数据(Data) ?

  我们经常说“ 水的温度是30℃,礼物的重量是500克,竹竿的长度是2米,大楼的高度50层“。通过水,温度,30℃,礼物,重量,500克,竹竿,长度,2米,大楼,高度,50层这些关键词,我们的大脑里就形成了对客观世界的印象。这些约定俗成的字符或关键词就构成了我们探讨的数据基础。不同领域的人在描述同一事物可能会出现不同的数据描述。比如中国人叫星期天,英语国家的人叫Sunday,还有教徒叫礼拜天。最后我们对数据进行这样的定义:数据是使用约定俗成的关键词,对客观事物的数量、属性、位置及其相互关系进行抽象表示。数据可以是事实,例如数字、文字、测量、观察结果,甚至可以是事物的描述。 

定性(Qualitative)与定量(Quantitative

  数据可以是定量或者定性的

  定量属性是指以数量形式存在着的属性,并因此可以对其进行测量。

  定性是指通过非量化的手段来探究事物的本质。包括观测、实验和分析等。

  比如某女对这个男人的描述,“2套房产,工资每月1万。”这是定量分析。“他是个好人,他很帅”。这是定性分析。 

  定量数据可以分成离散和连续的:

  • 离散数据(Discrete data只可以是某些既定的值(例如整数),通过计数取得。例如职工人数。
  • 连续数据(Continuous data可以是在一个区间范围里的任何值,通过测量取得。例如8月份的降雨量。
  • 数据是否无限可分是判断连续和离散的依据。身高的数据是整数,如果提高精度可以量出小数点后面很多位,因此是连续数据。而计数的、分类的、等级的数据是离散的,因为数据无法继续分割了。

相关(Correlation)

当两组数据有紧密的关联时,我们说他们是高相关的。

  • 正相关是两组数值一起增加
  • 负相关是当一组数值增加时,另一组数值减小

像这样:(图表下方数值是“相关系数”,最早由统计学家卡尔·皮尔逊设计的统计指标,是研究变量之间线性相关程度的量,一般用字母 r 表示。由于研究对象的不同,相关系数有多种定义方式,较为常用的是皮尔逊相关系数。)

技术图片

引用来源:https://www.mathsisfun.com/data/scatter-xy-plots.html

技术图片

数据基础学习之一

标签:位置   ret   提高   www   增加   不同   方式   loading   alt   

原文地址:https://www.cnblogs.com/fuyudata/p/13616386.html

(0)
(0)
   
举报
评论 一句话评论(0
登录后才能评论!
© 2014 mamicode.com 版权所有  联系我们:gaon5@hotmail.com
迷上了代码!