inodo为索引节点, 存放文件属性的信息(实际文件位置与容量信息 /black文件属性) 作用在格式化文件系统时候产生 创建一个文件就占用一个inode 数字相同为硬链接 black为实际数据/内容存放位置 默认4k 创建大文件会占用多个block 小文件浪费block 创建空文件不占用black ...
分类:
其他好文 时间:
2019-02-03 11:09:44
阅读次数:
189
1.查看磁盘大小使用df命令df的主要功能是查看linux服务器的磁盘使用情况的,用来查看磁盘使用空间,剩余空间。df【选项】【文件】显示指定磁盘文件的可用空间。如果没有文件名被指定,则所有当前被挂载的文件系统的可用空间将被显示。默认情况下,磁盘空间将以1KB为单位进行显示,除非环境变量POSIXLY_CORRECT被指定,那样将以512字节为单位进行显示。-a全部文件系统列表-h方便阅读方式显示
分类:
系统相关 时间:
2019-01-22 18:36:58
阅读次数:
319
1.查看磁盘大小使用df命令df的主要功能是查看linux服务器的磁盘使用情况的,用来查看磁盘使用空间,剩余空间。df【选项】【文件】显示指定磁盘文件的可用空间。如果没有文件名被指定,则所有当前被挂载的文件系统的可用空间将被显示。默认情况下,磁盘空间将以1KB为单位进行显示,除非环境变量POSIXLY_CORRECT被指定,那样将以512字节为单位进行显示。-a全部文件系统列表-h方便阅读方式显示
分类:
系统相关 时间:
2019-01-22 15:08:09
阅读次数:
249
本例要求为后续的PXE服务器构建提供RHEL7软件仓库,完成下列任务: 1.2 方案 PXE网络装机的整体思路 —— 装机条件准备: 准备RHEL7安装源(HTTP方式YUM库) 启用DHCP服务 PXE网络装机的整体思路 —— PXE引导配置: 启用TFTP服务,提供装机用的内核、初始化文件 提供 ...
分类:
其他好文 时间:
2019-01-21 20:05:09
阅读次数:
197
1.HDFS 修复 问题描述:其他部门在yarn平台上跑spark 程序错误的生成了海量的不到100K的小文件,导致namenode压力过大,其中一个namenode宕机后,没有及时发现 使得edits文件大量积累,在namenode1宕机后,namenode2 随后在凌晨1点也宕机。 原因分析:N ...
分类:
其他好文 时间:
2019-01-18 12:57:14
阅读次数:
229
1.自定义InputFormat–数据分类输出 需求:小文件的合并 分析: -在数据采集的时候,就将小文件或小批数据合成大文件再上传HDFS -在业务处理之前,在HDFS上使用MapReduce程序对小文件进行合并 -在MapReduce处理时,可采用CombineFileIn
分类:
其他好文 时间:
2019-01-13 14:23:38
阅读次数:
167
(一)海量日志数据,提取出某日访问百度次数最多的那个IP。 首先是这一天,并且是访问百度的日志中的IP取出来,逐个写入到一个大文件中。注意到IP是32位的,最多有个2^32个IP。同样可以采用映射的方法, 比如模1000,把整个大文件映射为1000个小文件,再找出每个小文中出现频率最大的IP(可以采 ...
分类:
其他好文 时间:
2019-01-11 18:08:03
阅读次数:
254
1.HDFS的设计思路? hdfs是分布式的文件系统,用来在廉价的集群上做大数据量的存储。1.大文件被切割成小文件,使用分而治之的思想让很多服务器对同一个文件进行联合管理2.每个小文件做冗余备份,并且分散存到不同的服务器,做到高可靠不丢失2.HDFS的架构?namenode:集群老大,掌管文件系统目录树,处理客户端读且请求SecondaryNamenode:持久化元数据,主要
分类:
其他好文 时间:
2019-01-11 14:46:18
阅读次数:
164
NIO和IO的区别NIO:newIO有的文章说,NIO用到的是块,也就是每次读入较多的数据缓存,因此使用效率比IO要高些。IO:面向流,阻塞IONIO:面向缓冲,非阻塞IO,有selector的支持。阻塞IO读写的好处,每次返回都必然是读写完成了,适用于一个线程处理一个连接,且连接处理发送接收数据量较大的情况。非阻塞IO每次读写返回未必是你想要的数据都读写完成了,即不会等待IO真正完成具体操作,因
分类:
编程语言 时间:
2019-01-11 11:34:37
阅读次数:
220
描述:要求浏览器单个上传文件大小不超过10M。 解决方案: ...
分类:
Web程序 时间:
2019-01-08 15:40:05
阅读次数:
206