MapReduce的工作流程 1.客户端将每个block块切片(逻辑切分),每个切片都对应一个map任务,默认一个block块对应一个切片和一个map任务,split包含的信息:分片的元数据信息,包含起始位置,长度,和所在节点列表等 2.map按行读取切片数据,组成键值对,key为当前行在源文件中的 ...
分类:
其他好文 时间:
2019-12-26 20:57:26
阅读次数:
74
题目:有n个句子,每个句子的长度都小于等于m,现在需要将相邻较短的句子拼接再一起,使得句子的数量最少,并且长度仍然不大于m,而且拼接完之后句子的长度的方差最小。求拼接方式。 解题(自己给自己出题,sent_comb3切分符合要求): ...
分类:
编程语言 时间:
2019-12-24 09:20:43
阅读次数:
76
点云的搜索kdtree太重要,想要从头手撸一个枝叶分离的代码,所以开始吧。 参考: https://zhuanlan.zhihu.com/p/45346117 https://leileiluoluo.com/posts/kdtree-algorithm-and-implementation.htm ...
分类:
其他好文 时间:
2019-12-20 14:02:07
阅读次数:
98
Storm WordCount 工作过程 Storm 版本: 1、Spout 从外部数据源中读取数据,随机发送一个元组对象出去; 2、SplitBolt 接收 Spout 中输出的元组对象,将元组中的数据切分成单词,并将切分后的单词发射出去; 3、WordCountBolt 接收 SplitBolt ...
分类:
其他好文 时间:
2019-12-17 23:57:11
阅读次数:
171
Istio是一个提供连接、保护、控制以及观测微服务功能的开放平台。 微服务目前被越来越多的IT企业重视。微服务是将复杂的应用切分为若干服务,每个服务均可以独立开发、部署和伸缩;微服务和容器组合使用,可进一步简化微服务的交付,提升应用的可靠性和可伸缩性。 随着微服务的大量应用,其构成的分布式应用架构在 ...
分类:
其他好文 时间:
2019-12-17 10:25:33
阅读次数:
99
动态规划之斐波那契数列 动态规划是将一个问题切分成子问题并将子问题的结果存储起来避免重复计算的一种算法。 它有两个要件: 1)重复子问题 2)最优子结构 和分治法一样,动态规划也是有自己的子问题,所以如果没有重复子问题,那么动态规划就无法使用,因为动态规划的作用就是存储重复子问题的值;反例是,二分查 ...
分类:
其他好文 时间:
2019-12-16 13:12:46
阅读次数:
116
概要 HashMap 最早出现在 JDK 1.2 中,底层基于散列算法实现。HashMap 允许 null 键和 null 值,在计算哈键的哈希值时,null 键哈希值为 0。HashMap 并不保证键值对的顺序,这意味着在进行某些操作后,键值对的顺序可能会发生变化。另外,需要注意的是,HashMa ...
分类:
其他好文 时间:
2019-12-15 18:48:40
阅读次数:
99
使用朴素贝叶斯解决一些现实生活中 的问题时,需要先从文本内容得到字符串列表,然后生成词向量。 准备数据:切分文本 测试算法:使用朴素贝叶斯进行交叉验证 文件解析及完整的垃圾邮件测试函数 ...
分类:
编程语言 时间:
2019-12-15 10:56:42
阅读次数:
112
主要有四个方法: search : 从字符串的任意位置开始检索,首次匹配即结束 findall : 全部匹配 sub : 将正则匹配结果进行替换 split : 根据正则匹配结果将字符串进行切分,然后返回一个列表 import re ''' search 从字符串的任意位置搜索匹配,检索到第一个匹配 ...
分类:
其他好文 时间:
2019-12-06 23:33:00
阅读次数:
139
原文:https://www.cnblogs.com/butterfly100/p/9034281.html 复制过来收藏 数据库分库分表思路 一. 数据切分 关系型数据库本身比较容易成为系统瓶颈,单机存储容量、连接数、处理能力都有限。当单表的数据量达到1000W或100G以后,由于查询维度较多,即 ...
分类:
数据库 时间:
2019-12-06 13:12:33
阅读次数:
139