1.1 当初为什么报”软件工程“|”大数据“ 这个专业?对电脑感兴趣,想了解一个软件是如何形成的 1.2 当初对 XX 专业的期待和想象是什么?和电视里的黑客一样 神秘又聪明 1.3 当初希望自己是如何投入这个专业的学习的?和以往一样学习 刻苦钻研 1.4 结合过去的一学期,你目前在专业学习方面情况 ...
分类:
其他好文 时间:
2020-06-07 21:21:29
阅读次数:
80
一、Hive的压缩和存储 1,MapReduce支持的压缩编码 压缩格式 工具 算法 文件扩展名 是否可切分 对应的编码/解码器 DEFLATE 无 DEFLATE .deflate 否 org.apache.hadoop.io.compress.DefaultCodec Gzip gzip DEF ...
分类:
其他好文 时间:
2020-06-07 19:08:04
阅读次数:
65
1.背景环境 本文章来自最近做的项目模块的思考和总结,主要讲思路不涉及过多的基础和实现细节。 需求:统计出来纳税人名称、行业、近一年业务量(办税服务厅、电子税务局、自助渠道),近一年业务量top5(办税服务厅、电子税务局、自助渠道)、近一年纳税金额、近一年申报数、近一年用票数。支持根据所属税务机关分 ...
分类:
其他好文 时间:
2020-06-07 16:32:19
阅读次数:
344
说明:本文来自作者 邹毅 在 GitChat 上分享「 PHP 内存泄漏分析定位」 目录 场景一 程序操作数据过大 场景二 程序操作大数据时产生拷贝 场景三 配置不合理系统资源耗尽 场景四 无用的数据未及时释放 深入了解 php内存管理 php-fpm内存泄露问题 常驻进程内存泄露问题 前言 本文开 ...
分类:
Web程序 时间:
2020-06-07 15:09:16
阅读次数:
70
gRPC入门 gRPC是Google公司基于Protobuf开发的跨语言的开源RPC框架。gRPC基于HTTP/2协议设计,可以基于一个HTTP/2链接提供多个服务,对于移动设备更加友好。本节将讲述gRPC的简单用法。 gRPC技术栈 最底层为TCP或Unix Socket协议,在此之上是HTTP/ ...
分类:
其他好文 时间:
2020-06-07 15:01:06
阅读次数:
57
最近面试聚美优品以及睿沿科技都挂在一些开放性问题上,简单分享一下: (毕业面百度也是最后一面开放性问题挂了,感觉都喜欢问技术选型,大数据量储存检索解决方案) MQ 选型: ROCKETMQ整体架构: 负责消息储存的broker(包含topic,一个topic有多个队列), 负责消息投递的客户端,负责 ...
分类:
其他好文 时间:
2020-06-07 14:42:00
阅读次数:
82
消费者是品牌最重要的资产,如何能够更好地留存消费者是企业制胜的关键。以阿里为代表的平台也提出了要从“流量运营”向“消费者运营”的转型。在信息技术发展日新月异的今天,各大企业与平台纷纷建立了自己的大数据平台,累积了海量的数据,如何利用这些数据来洞察消费者,做好消费者运营,成为企业必修的一个课题。本文将 ...
分类:
其他好文 时间:
2020-06-07 09:17:50
阅读次数:
168
简介Hadoop是一个由Apache基金会所开发的分布式系统基础架构。用户可以在不了解分布式底层细节的情况下,开发分布式程序。充分利用集群的威力进行高速运算和存储。Hadoop实现了一个分布式文件系统(HadoopDistributedFileSystem),简称HDFS。HDFS有高容错性的特点,并且设计用来部署在低廉的(low-cost)硬件上;而且它提供高吞吐量(highthroughput
分类:
其他好文 时间:
2020-06-06 23:16:21
阅读次数:
84