1. 生成原始 RSA私钥文件 private_key.pem 2. 将原始 RSA私钥转换为 pkcs8格式 3. 生成 RSA公钥 rsa_public_key.pem 4. 从公钥 rsa_public_key.pem 获取十六进制的公钥(第一段16进制字符串) 最终获取文件列表: rsa_p ...
本文详细阐述了大小堆的创建,堆的插入和删除;为了加深记忆还用堆实现了优先级队列问题,topk问题,堆排序问题(包含原理,思路,代码实现,以及测试用例)。本文在windows平台下vs2008上采用C语言实现。 ...
分类:
其他好文 时间:
2018-02-26 11:29:20
阅读次数:
176
课程介绍 课程名称: 点击流日志分析 1、什么是点击流系统?记录用户在网站上的操作,用户行为轨迹。 2、日志有哪些需要注意的地方,如何采集日志(flume),日志格式,日志包含的信息量(字段) 3、分析什么? 网址来源,TOPK 客户端流量占比 Android、IOS、..... 网页热力图 课程目 ...
分类:
其他好文 时间:
2018-02-04 14:42:10
阅读次数:
2154
快速排序: 堆排序: 二叉树: 两种特殊二叉树: 二叉树的存储方式: 小结: 堆排序正题: 向下调整: 堆排序过程: 堆排序-内置模块: 扩展问题topk: 归并排序: 怎么使用: NB三人组小结 ...
分类:
编程语言 时间:
2018-02-01 17:32:14
阅读次数:
131
4. Median of Two Sorted Arrays 题目 解析 题目是这样的:给定两个已经排序好的数组(可能为空),找到两者所有元素中第k大的元素。另外一种更加具体的形式是,找到所有元素的中位数。本篇文章我们只讨论更加一般性的问题:如何找到两个数组中第k大的元素?不过,测试是用的两个数组的 ...
分类:
其他好文 时间:
2018-01-14 15:17:05
阅读次数:
137
topK问题是指从大量数据中获取最大(或最小)的k个数,比如从全校学生中寻找成绩最高的500名学生等等. 本问题可采用小根堆解决.思路是先把源数据中的前k个数放入堆中,然后构建堆,使其保持堆序(可以简单的看成k次insert操作).然后从源数据中的第k个数据之后的每个元素与堆的根节点(小根堆得roo ...
分类:
编程语言 时间:
2017-12-24 14:43:34
阅读次数:
187
package test; import java.util.Random; public class TSort { public static void main(String[] args) { TSort tsort = new TSort(); tsort.test(); } public... ...
分类:
编程语言 时间:
2017-08-16 21:44:17
阅读次数:
142
前言 在以往工作或者面试的时候常会碰到一个问题,如何实现海量TopN,就是在一个非常大的结果集里面快速找到最大的前10或前100个数,同时要保证 内存和速度的效率,我们可能第一个想法就是利用排序,然后截取前10或前100,而排序对于量不是特别大的时候没有任何问题,但只要量特别大是根本不可能 完成这个 ...
分类:
编程语言 时间:
2017-07-23 18:28:12
阅读次数:
323
TopK
TopK算法有两步,一是统计词频,二是找出词频最高的前K个词。
1.实例描述
假设取Top1,则有如下输入和输出。
输入:
HelloWorldByeWorld
HelloHadoopByeHadoop
ByeHadoopHelloHadoop
输出:
词Hadoop词频4
2.设计思路
首先统计WordCount的词频,将数据转化为(词,词频)..
分类:
编程语言 时间:
2017-07-21 22:06:30
阅读次数:
335
基于邻域的算法,就是最常见的CF协同过滤算法。分为 基于用户的 user based CF 和 基于物品的 item based CF. 1.user based CF 对目标用户u, 找出与之相似的用户集合 U,将U中用户感兴趣而u没见过的物品推荐给u. 用户相似度,通过将用户表示成商品的向量后计 ...
分类:
编程语言 时间:
2017-07-20 10:07:31
阅读次数:
183