通常会分为两种情况,一种是去除完全重复的行数据,另一种是去除某几列重复的行数据,就这两种情况可用下面的代码进行处理。 1. 去除完全重复的行数据 data.drop_duplicates(inplace=True) 2. 去除某几列重复的行数据 data.drop_duplicates(subset ...
分类:
编程语言 时间:
2021-02-15 12:17:56
阅读次数:
0
删除数据库 语法:DROP DATABASE 数据库名; 使用mysqladmin删除数据库 mysqladmin -u root -p drop bird 使用PHP脚本删除数据库 语法:mysqli_query(connection,query,resultmode); connection 规 ...
分类:
数据库 时间:
2021-02-15 12:16:23
阅读次数:
0
Hive 运行过程异常信息有时不能完全显示在终端上,此时可以用 Hive Debug 模 式进行调试 hive --hiveconf hive.root.logger=INFO,console 1、表不存在 FAILED: SemanticException [Error 10001]: Line ...
分类:
其他好文 时间:
2021-02-10 13:39:36
阅读次数:
0
字符函数 函数返回值型 函数(参数) 描述 string base64(binary bin) 将二进制 bin 转换成 64 位的字符串 string concat(string|binary A, string|binary B...) 对二进制字节码或字符 串按次序进行拼接 array<str ...
分类:
其他好文 时间:
2021-02-10 13:05:47
阅读次数:
0
聚合函数 函数返回值型 函数(参数) 描述 BIGINT count(*), count(expr), count(DISTINCT expr[, expr...]) 1.统计总行数,包括含有 NULL 值的行 2.count(expr) 统计提 供非 NULL 的 expr 表达式 值的行数 3. ...
分类:
其他好文 时间:
2021-02-10 13:04:58
阅读次数:
0
在围绕Hadoop形成的大数据技术生态当中,MapReduce的地位,在早期是处于核心地位的,但是伴随着数据处理实时性需求的不断提升,更多新的计算框架出现,MapReduce的地位受到压制,但是作为Hadoop原始计算框架,还是需要相应程度的了解和掌握的。今天的大数据入门分享,我们来具体讲一讲Map ...
分类:
其他好文 时间:
2021-02-09 12:33:28
阅读次数:
0
read_only 表示是否允许普通用户写入。如果为on,表示禁止普通用户写入。 super_read_only 表示是否禁止超级用户写入,包括普通用户,即针对所有用户。 默认关闭。 如果打开 super_read_only,则read_only会自动打开。 如果关闭 read_only,则 sup ...
分类:
数据库 时间:
2021-02-09 12:29:10
阅读次数:
0
rownum 和 row_number()的区别 一、 Oracle中的rownum 用于从查询返回的行的编号,返回的第一行分配的是1,第二行是2,依次类推。这个伪字段可以用于限制查询返回的总行数,而且rownum不能以任何表的名称作为前缀。 rownum对于等于某值的查询条件 如果希望找到学生表中 ...
分类:
数据库 时间:
2021-02-08 12:51:03
阅读次数:
0
首相要安装好hive 1.首先修改配置文件文件为hive 路径下的 conf/hive-sit.xml 将内容增加 <property> <name>hive.server2.thrift.port</name> <value>10000</value> <description>Port numb ...
分类:
数据库 时间:
2021-02-08 12:21:57
阅读次数:
0
如果提供比较,则使用委托表示的方法对列表中的元素进行排序。如果comparison为null,则抛出ArgumentNullException。 此方法使用数组.排序,其应用自省排序,如下所示: 如果分区大小小于或等于16个元素,则使用插入排序算法 如果分区数超过2logn,其中n是输入数组的范围, ...