以下全为个人理解,若不全面,你打我啊! 首先,本书分成三个部分: 第一:数据的操作。(第二、四、五、十五章) 分为数据结构(合并与重塑),变量或观测(创建,修改,删除,重命名,选取),特殊值的处理(缺失值处理),以及一般函数。 第二:图形的绘制。(第三、六、十一章) 分为一维变量,二维变量,三维及多 ...
分类:
编程语言 时间:
2016-04-14 23:55:23
阅读次数:
239
一、RS介绍 1.显示评分:直接从用户来 隐式评分:从用户活动推测得到的 2.预测是偏好的估计,是预测缺失值,推荐是从其他用户推荐项目,是推荐感兴趣的项目。 3.协同表示利用其它用户的数据 二、欢迎来到本课程 1.TFIDF:overlap 重叠 2.taxonomy:分类研究 3.roadmap: ...
分类:
其他好文 时间:
2016-04-11 12:11:42
阅读次数:
146
常用的统计函数如表5-3所示,其中许多函数都拥有可以影响输出结果的可选参数。举例来说:y<-mean(x)提供了对象x中元素的算术平均数,而:y<-mean(x,trim=0.05,na.rm=TRUE)则提供了截尾平均数,即丢弃了最大5%和最小5%的数据和所有缺失值后的算术平均数。请使用help()了解..
分类:
编程语言 时间:
2016-04-05 02:17:59
阅读次数:
187
一、创建新变量 transform()函数 二、变量的重编码 (1) (2) 三、变量的重命名 (1)fix()调用一个交互式编辑器 (2)reshape包中的rename() (3)names() 四、缺失值 在分析中排除缺失值 na.omit()会删除整行,更精妙的缺失值处理在15章中讲述。 五 ...
分类:
其他好文 时间:
2016-03-29 16:26:46
阅读次数:
229
3.1 数据预处理 数据质量的三个要素:准确性、完整性和一致性。 3.1.2 数据预处理的主要任务 数据清理:填写缺失的值,光滑噪声数据,识别或删除离群点,并解决不一致性来”清理“数据。 数据集成: 数据归约: 3.2 数据清理 3.2.1 缺失值 1.忽略元组 2.人工填写缺失值 3.使用一个全局
分类:
其他好文 时间:
2016-02-14 22:10:12
阅读次数:
288
1、缺失值有数值缺失,字符缺失; 2、问题:PROC TABULATE制表CLASS有缺失,目的将缺失值域某个非缺失值归属为一类,其他的按照实际操作,剩余用OTHER. PROC FORMAT; VALUE BASEFMT '', '0' = "01. Missing" '1' = "02. A C
分类:
其他好文 时间:
2016-02-02 21:30:38
阅读次数:
302
1、df.dropna() 可以返回去掉NaN的df结果集。2、pandas中dataframe取差集:df=pd.DataFrame({"name":[1,2,3,np.NaN,8],"value":[3,4,np.NaN,9,0]})drop_na_df=df.dropna()na_symbol...
分类:
其他好文 时间:
2015-11-09 15:44:04
阅读次数:
746
1.计算外部董事比例collapse (count) indratio if indratio==2,by(stkcd year)2.合并数据merge m:m stkcd year using C:\Users\ASUS\Desktop\intradio3.缺失值替换replace vc_shar...
分类:
其他好文 时间:
2015-10-25 14:58:44
阅读次数:
195
1.计算缺失值比例perNA=8)Data2[NAIDX]=minSize,])
分类:
编程语言 时间:
2015-10-25 10:44:48
阅读次数:
185
很简单,提供两种解法。
(1)等差数列先求得总和,然后减去给定的队列,剩下的值就是缺失值。
(2)先排个序,逐个比较,不等的直接return
第一种的代码:
class Solution {
public:
int missingNumber(vector& nums) {
int n = nums.size();
int expect = (n+1...
分类:
其他好文 时间:
2015-10-25 01:03:05
阅读次数:
224