题目
给定一个最多包含40亿个随机排列的无符号32位整数的顺序文件,找出一个不在文件中的32位整数(文件中一定至少缺失一个这样的数)。在具有足够内存的情况下,如何解决该问题?如果有几个外部的临时文件可用,但是仅仅有几百字节的内存,又该如何解决该问题?
思路(仅考虑单机情况)
关于括号的提示——文件中一定至少缺失一个这样的数: 一个无符号32位的整数的最大为 2322^{32},即42949672...
分类:
编程语言 时间:
2015-04-13 13:01:05
阅读次数:
147
文件是永久存储在磁盘等介质上的一主数据。文件的类型分类,按存储方式及结构,可分为顺序文件和随机文件;按文件数据的组织格式,可分为ASCII 文件 和 二进制文件。文件编码: 编码是一个将一组Unicode 字符串转换成一个字节序列的过程,解码是一个反向操作过程,将一个编码字节序列转换成一组Uni.....
各种计算机应用系统通常把一些相关信息组织起来保存在外存储器中,称为文件,并用一个名字(称为文件名)加以标识C++把文件看成无结构的字节流,编码方式: 文本文件 二进制文件存取方式: 顺序文件 随机文件ifstream、ofstream 和 fstream 类用于内存与文件之间的数据传输1.文件操.....
分类:
编程语言 时间:
2015-03-14 19:53:32
阅读次数:
136
首先这几个函数的使用方法请移步
fseek 点击打开链接
fread点击打开链接
fwrite点击打开链接
进入正题:
在更新一个顺序文件中选定的记录时,我们需要对文件可读又可写,为了保持与过去不能同时进行读写操作的程序的向下兼容性,一个输出操作不能随后直接紧跟一个输出操作,反之亦然。如果要同时进行输入和输出操作,必须在其中插入fseek函数的调用。fseek(fp,0L,1);这个...
分类:
其他好文 时间:
2015-02-13 09:46:31
阅读次数:
177
概念
SequenceFile是一个由二进制序列化过的key/value的字节流组成的文本存储文件,它可以在map/reduce过程中的input/output
的format时被使用。在map/reduce过程中,map处理文件的临时输出就是使用SequenceFile处理过的。 所以一般的SequenceFile均是在FileSystem中生成,供map调用的原始文件。
...
分类:
其他好文 时间:
2014-12-10 22:48:16
阅读次数:
280
1.对于多关键字而言,那种文件组织方便而又高效()A、顺序文件 B、倒排文件 C、散列文件 D、B+树索引文件 文件在外存上的基本的组织方式有四种:顺序组织,索引组织,散列组织和链组织;对应的的文件名称分别为:顺序文件、索引文件、散列文件和多关键字文件。选择哪一种文件组织方式,取决于对文件中记录的....
分类:
其他好文 时间:
2014-10-01 17:07:41
阅读次数:
302
外存,指的是除了cpu缓存和内存以外的存储器,硬盘、光盘、U盘都可以被称为外存。所有的数据,也都存在这里面,故他的分配方式变得极其重要,这直接影响到了计算机的运行速度。 外存分配方式主要有这几种:连续分配,链式分配,索引分配。 一. 连续分配 原理:创建文件时,分配一组连续的块;FAT(文档分配表)中每个文件只要一项,说明起始块和文件长度。对于顺序文件有利。 优点:1.简便。适用于一次性写入操作...
分类:
其他好文 时间:
2014-09-09 18:22:59
阅读次数:
255
A. 给定一个最多包含40亿个随机排列的32位整数的顺序文件,找出一个不在文件中的32位整数(在文件夹中至少缺失一个这样的数-为什么?)。在具有足够内在的情况下,如何解决该问题?如果有几个外部的“临时”文件可用,但是仅有几百字节的内存,又该如何解决该问题?B.将一个n元一维向量向左旋转i个位置。例如...
分类:
其他好文 时间:
2014-07-10 00:20:45
阅读次数:
226
一、题目:
A题:给定一个最多包含40亿个随机排列的32位整数的顺序文件,找出一个不在文件中的32位整数。在文件中至少存在这样一个数? 1、如果有足够的内存,如何处理?
2、如果内存不足,仅可以用文件来进行处理,如何处理?...
分类:
其他好文 时间:
2014-06-07 08:34:37
阅读次数:
359