概述 在Google中随意搜索,如下所示: 他会自动显示相关的搜索,不知道有没有想过这个功能是如何实现的呢?面对海量的数据,它怎么能在我输入的同时,如此快速的检索到相关内容呢?当我查找资料后,就遇到了它,Trie树。 What? Trie树是个什么玩意呢?为啥他能快速进行检索?Trie树也叫字典树。 ...
分类:
其他好文 时间:
2019-11-10 17:24:36
阅读次数:
99
在应用系统开发初期,由于开发数据库数据比较少,对于查询sql语句,复杂试图的编写等体会不出sql语句各种写法的性能优劣,但是如果将应用系统提交实际应用后,随着数据库中数据的增加,系统的响应速度就成为目前系统需要解决的最主要问题之一。系统优化中一个很重要的方面就是sql语句的优化。对于海量数据,劣质s ...
分类:
数据库 时间:
2019-11-09 23:49:54
阅读次数:
139
告警平台是IT运营中的中场组织核心,囊括了所有关键信息,并能做到告警收敛和择优选取。
分类:
其他好文 时间:
2019-11-08 19:23:03
阅读次数:
128
物联网(IoT,或者说工业互联网)的基础在于设备之间的通信,通信协议在将海量设备连接到互联网时发挥着重要作用。本文介绍IoT中的通信/通讯协议,并对常用的协议如:MQTT, CoAp, OPC UA, Modbus, Profinet ,介绍其特点,并进行比较,说明协议的适用场景。先上一张大图。 I ...
分类:
其他好文 时间:
2019-11-08 12:08:39
阅读次数:
454
关于数据可视化: 帮助人们更快地理解数据(它可以突出显示一个大的数据量,并且业务人员可以快速地发现关键点) 非常强大的展示巨量数据的能力(海量的数据只需要使用图表展示就可以做到) 提高了解释信息的能力(从海量的数据和信息中寻找联系并不容易,图形和图表即可一目了然,使得它简单而有效地概括数据) 来自链 ...
分类:
其他好文 时间:
2019-11-07 15:06:04
阅读次数:
94
2019年7月,百度ERNIE再升级,发布持续学习的语义理解框架ERNIE 2.0,及基于此框架的ERNIE 2.0预训练模型,本篇内容教大家如何下载和使用!
分类:
其他好文 时间:
2019-11-06 09:12:55
阅读次数:
145
[编程题]用户喜好 时间限制:3秒 空间限制:262144K 为了不断优化推荐效果,今日头条每天要存储和处理海量数据。假设有这样一种场景:我们对用户按照它们的注册时间先后来标号,对于一类文章,每个用户都有不同的喜好值,我们会想知道某一段时间内注册的用户(标号相连的一批用户)中,有多少用户对这类文章喜 ...
分类:
编程语言 时间:
2019-11-06 01:13:46
阅读次数:
189
特征: 持续到达,数据量大,注重数据整体价值,数据顺序可能颠倒,丢失,实时计算, 海量,分布,实时,快速部署,可靠 linked in Kafka spark streaming:微小批处理,模拟流计算,秒级响应 DStream 一系列RDD 的集合 支持批处理 创建文件流 10代表每10s启动一次 ...
分类:
其他好文 时间:
2019-11-05 18:49:38
阅读次数:
98
String.format由于每次都有生成一个Formatter对象,因此速度会比较慢,在大数据量需要格式化处理的时候,避免使用String.format进行格式化,相反使用StringUtils.leftPad,StringUtils.rightPad,然后使用+一次性(注:分为多个独立的+性能会 ...
分类:
编程语言 时间:
2019-11-05 13:57:58
阅读次数:
201
算力 和 数据 是影响深度学习的两个关键因素。在算力满足的情况下,为了达到更好的效果,我们就需要提供海量优质素材数据给神经网络,以求训练出来高精度的网络模型。在平时的测试过程中,也发现基于深度学习的算法, 素材的数量 、 素材的均衡度 和 标注的质量 对训练出来的模型精度 ...
分类:
其他好文 时间:
2019-11-05 01:19:29
阅读次数:
699