2.4 字符处理函数 2.5 其他实用函数 2.6 将函数应用于矩阵和数据框 3. 数据处理难题的一套解决方案 quantile() http://blog.csdn.net/u012543538/article/details/17025789 scale() http://blog.sina.c ...
分类:
编程语言 时间:
2017-09-10 22:53:37
阅读次数:
334
Top/Bottom N First/Last NTile -- ①对所有客户按订单总额进行排名 -- ②按区域和客户订单总额进行排名 -- ③找出订单总额排名前13位的客户 -- ④找出订单总额最高、最低的客户 -- ⑤找出订单总额排名前25%的客户 -- 此处 null 被排到第一位 , 可以加... ...
分类:
数据库 时间:
2017-08-20 19:59:49
阅读次数:
195
Ø 基本常用查询 --select select * from student; --all 查询所有 select all sex from student; --distinct 过滤重复 select distinct sex from student; --count 统计 select c... ...
分类:
数据库 时间:
2017-08-17 14:32:20
阅读次数:
220
不知不觉,实习近一个月了,这期间,写了一套数据分析代码,初步学习了利用hugo建个人blog,虽然还没建起来。。。 学习了他人的code,发现自己在写代码中有一些不好的毛病:不能打开脑洞使用更多方便的函数或者命令。因此现总结一下自己平时不习惯用的但是非常实用的命令,争取以后写code时消化进去。 首 ...
分类:
其他好文 时间:
2017-08-10 15:37:08
阅读次数:
143
继续介绍几个序列函数:NTILE。ROW_NUMBER,RANK和DENSE_RANK环境信息:Hive版本号为apache-hive-0.14.0-binHadoop版本号为hadoop-2.6.0Tez版本号为tez-0.7.0数据:P088888888888,2016-02-10,1P0888 ...
sklearn 的数据集有好多个种 自带的小数据集(packaged dataset):sklearn.datasets.load_<name> 可在线下载的数据集(Downloaded Dataset):sklearn.datasets.fetch_<name> 计算机生成的数据集(Generat ...
分类:
其他好文 时间:
2017-06-10 23:29:12
阅读次数:
873
1.介绍 有三种不同的方法来评估一个模型的预测质量: estimator的score方法:sklearn中的estimator都具有一个score方法,它提供了一个缺省的评估法则来解决问题。 Scoring参数:使用cross-validation的模型评估工具,依赖于内部的scoring策略。见下 ...
分类:
其他好文 时间:
2017-06-08 21:28:47
阅读次数:
630
1 row_number 2 rank 3 dense_rank 4 ntile 例子如下: select * into #MyTablefrom(select '语文' as 课程,70 as 成绩 union all select '数学' ,80 union all select '数学' , ...
分类:
数据库 时间:
2017-04-17 00:32:40
阅读次数:
241
-- 开窗函数:在结果集的基础上进一步处理(聚合操作) -- Over函数,添加一个字段显示最大年龄 SELECT * , MAX(StuAge) OVER ( ) MaxStuAge FROM dbo.Student; -- Over函数,添加一个字段显示总人数 SELECT * , COUNT(... ...
分类:
数据库 时间:
2017-01-26 11:34:24
阅读次数:
220
1 求和函数 sum() 求积函数product() 加权平均数 average() var()求方差 mean()求期望 std()求标准差 说明:在sum()函数中,也可以对列表元祖等与数组类似的序列求和。当数组多维度时,他计算的时所有元素的和。如果指定维度参数axis,则求和沿着指定轴进行。二 ...
分类:
其他好文 时间:
2016-12-20 13:48:08
阅读次数:
2854