业务模型: 在关系型数据库中有张很大的表,被设计成奇偶库存储,每个库100张一模一样的表,每张表存储1000W,字段切换到下一个表。现需要同步这个数据到hive中(hdfs),循环抽取这些数据。如果是抽取增量的带上增量字段(每天增量数据存储在哪个表,奇数库还是偶数库是不知道的)。...
分类:
其他好文 时间:
2014-10-01 09:25:40
阅读次数:
367
Scrapy的整个数据处理流程由Scrapy引擎进行控制,其主要的运行方式为:引擎打开一个域名,蜘蛛处理这个域名,然后获取第一个待爬取的URL。引擎从蜘蛛那获取第一个需要爬取的URL,然后作为请求在调度中进行调度。引擎从调度那获取接下来进行爬取的页面。调度将下一个爬取的URL返回给引擎,引擎将他们通...
分类:
其他好文 时间:
2014-10-01 08:08:30
阅读次数:
427
题目大意:输入一个字符串,输出它的下一个字典序排列。
字典序算法思想:
1.从右向左寻找字符串找出第一个a[i]
2.从右向左找出第一个大于a[j]的元素a[i];
3.swap(a[i],a[j])
4.将a[i]......到a[stelen(a)]倒序
5.输出a
代码如下:
#include
#include
#include
#include
#include
usin...
分类:
其他好文 时间:
2014-09-30 22:56:00
阅读次数:
235
题意:
给范围[X,Y],求范围内双峰数位数和最大值是多少。
双峰数定义就是满足一个数 可以分割成两个 /\ /\ 的形式。
思路:
dp[site][cur][ok] site位 前面的数是cur 状态为ok
ok分为7种
0:前面所有数都是0
1:第一个峰数且只有一个数
2:第一个峰数在峰顶(可上可下)
3:第一个峰数在峰底(可进入下一个峰或者继续往下)
4:同1 是第...
分类:
其他好文 时间:
2014-09-30 20:06:29
阅读次数:
219
题目:计算一定经过给定点的八皇后。
分析:搜索。因为八皇后只有92组解,直接计算出92组解,然后查询输出即可。
这里我使用了位运算来计算八皇后,减少代码量。
先考虑一个皇后的影响,每次下一层攻击的点和上一次的关系如下:
一个皇后会影响自己下方和左右两个斜的方向(从上往下搜索);
向左的斜的...
分类:
其他好文 时间:
2014-09-30 19:17:40
阅读次数:
232
====================问题描述==================== 用ContentResolver显示出来的联系人列表,点击某一联系人后跳转到发短信界面,要咋样把联系人的姓名传递到短信界面呢,求大神 ...
分类:
其他好文 时间:
2014-09-30 16:53:29
阅读次数:
187
以前使用ADO, 如果SQL返回的结果集有多个 可以通过NextRecordset来依次获取代码移植到FireDAC, 对于多结果集处理差不多, 但是还是有一些不一样的地方:1.TDataSet本身是不支持多结果集的, 所以不要再这个上面浪费精力2.切换到下一个结果集, ADO.NextRecord...
分类:
其他好文 时间:
2014-09-30 14:43:29
阅读次数:
232
一个数组有n个元素,假如前面n-1个元素已经排序好了,那么把第n个元素插入到前面n-1个元素,使得数组有序排列,就是插入排序了。
至于n-1个元素如何已经先排序好,那么我们可以假设前面n-2个元素已经排序好,把第n-1个元素插入到前面n-2个元素。
依次类推,直到只剩下一个元素,也就是第一个元素。排序完成。
代码如下:
#include
using namespace std;
...
分类:
其他好文 时间:
2014-09-30 09:28:52
阅读次数:
192
首先说明,对于linux系统而言,tcp/ip协议栈是工作在内核空间中实现而且在内核中是按照流水线方式实现的当我们去接收一个报文时,由各栈去解封装,而这是由流水线去处理的而流水线是非copy类型的,所谓非copy类似就是直接送往下一个流水线而不是从TCP内存中复制到IP栈的内存,..
分类:
系统相关 时间:
2014-09-29 21:26:13
阅读次数:
522
虚拟机bind0bind双网卡步骤1:第一种模式:mod=0,即:(balance-rr)Round-robinpolicy(平衡抡循环策略)特点:传输数据包顺序是依次传输(即:第1个包走eth0,下一个包就走eth1….一直循环下去,直到最后一个传输完毕),此模式提供负载平衡和容错能力;但是我们知...
分类:
其他好文 时间:
2014-09-29 13:16:10
阅读次数:
784