hashlib模块 前言 python的hashlib提供了常见的摘要算法,如MD5、SHAI等。 摘要算法又称哈希算法、散列算法。它通过一个函数,吧任意长度的数据转换为一个长度固定的数据串(通常用16进制的字符串表示)。 摘要算法是通过摘要函数f()对任意长度的数据计算出固定长度的摘要digest ...
分类:
其他好文 时间:
2018-05-24 16:31:17
阅读次数:
152
C语言数组 数组:用来存储一组数据。 计算C语言的数组长度 C语言数组和函数 数组作为函数参数,可以省略元素个数 `补充:数组作为函数参数,传递的是整个数组的地址,修改了函数形参数组的值,会影响到外面实参的数据。` ...
分类:
编程语言 时间:
2018-05-23 10:21:49
阅读次数:
152
前言 在大数据计算领域,Spark已经成为了越来越流行、越来越受欢迎的计算平台之一。Spark的功能涵盖了大数据领域的离线批处理、SQL类处理、流式/实时计算、机器学习、图计算等各种不同类型的计算操作,应用范围与前景非常广泛。在美团?大众点评,已经有很多同学在各种项目中尝试使用Spark。大多数同学 ...
分类:
其他好文 时间:
2018-05-18 20:14:40
阅读次数:
157
xml是一种可扩展标记语言,在电子计算机中,标记指计算机所能理解的信息符号,通过此种标记,计算机之间可以处理包含各种的信息比如文章等。它可以用来标记数据、定义数据类型,是一种允许用户对自己的标记语言进行定义的源语言。 它非常适合万维网传输,提供统一的方法来描述和交换独立于应用程序或供应商的结构化数据 ...
分类:
Web程序 时间:
2018-05-18 00:24:04
阅读次数:
218
从SQL到SPL基本查询语法迁移 之多表操作上一篇我们针对单表的情形了解了如何把数据计算从SQL查询迁移到集算器,或者更准确地说,迁移到集算器所使用的SPL集算语言。这个迁移过程,既有相同的概念,也有不同的思路。接下来,我们一起针对多表的情况看一下集算器和SPL语言是如何发挥更大的优势的。JOIN连接两个记录在前面的例子中,我们得到了每个雇员的销售额,如果进一步还想知道每个雇员给出的最小
分类:
其他好文 时间:
2018-05-15 17:23:32
阅读次数:
217
1)TCP三次握手 第一次握手:客户端A将标志位SYN置为1,随机产生一个值为seq=J(J的取值范围为=1234567)的数据包到服务器,客户端A进入SYN_SENT状态,等待服务端B确认; 第二次握手:服务端B收到数据包后由标志位SYN=1知道客户端A请求建立连接,服务端B将标志位SYN和ACK ...
分类:
编程语言 时间:
2018-05-13 10:37:47
阅读次数:
173
一、前言 Spark作为大数据计算引擎,凭借其快速、稳定、简易等特点,快速的占领了大数据计算的领域。本文主要为作者在搭建使用计算平台的过程中,对于Spark的理解,希望能给读者一些学习的思路。文章内容为介绍Spark在DataMagic平台扮演的角色、如何快速掌握Spark以及DataMagic平台 ...
分类:
其他好文 时间:
2018-05-11 17:23:04
阅读次数:
169
摘要在MySQL5.7中,支持俩种的GeneratedColumn,即VirtualGeneratedColumn和StoredGeneratedColumn,前者只将GeneratedColumn保存在数据字典中(表的元数据),并不会将这一列数据持久化到磁盘上;后者会将GeneratedColumn持久化到磁盘上,而不是每次读取的时候计算所得。很明显,后者存放了可以通过已有的数据计算得的数据,需
分类:
数据库 时间:
2018-05-09 16:02:07
阅读次数:
174
项目实战案例:搜狗日志查询分析数据:一、电商大数据平台整体架构1、大数据(Hadoop、Spark、Hive)都是一种数据仓库的实现方式核心问题:数据存储、数据计算什么是数据仓库?传统的解决大数据的方式,就是一个数据库一般只做查询2、大数据平台整体的架构部署:Apache、Ambari(HDP)、CDH二、在项目中使用使用瀑布模型(软件工程:方法论)1、瀑布模型几个阶段?2、每个阶段完成的任务三、
分类:
其他好文 时间:
2018-05-06 16:22:50
阅读次数:
160
数据截图: 该数据包含了2006年-2015年10年间亚洲地区人口数量数据,共10行50列数据。我们需要使用Numpy完成如下数据任务: 示例代码: 2.7_亚洲国家人口数据计算 ...
分类:
其他好文 时间:
2018-04-30 18:04:48
阅读次数:
243