码迷,mamicode.com
首页 >  
搜索关键字:分布    ( 32293个结果
互联网广告的个性化推荐平台设计--相关知识
人群分类模型 依据用户人群数据记录。建立人群属性分类模型。根绝用户特点。将用户标记为特定类别。据此进行精准定向服务。并进行效果评估。主要分类方法: 1.採用模糊数学综合判定理论,构建关系矩阵。判定类别属性的映射关系。採样真实数据,模拟真实数据分布。统计属性取值的概率分布,作为概率的预计值,另外,将广 ...
分类:其他好文   时间:2017-07-22 16:58:58    阅读次数:218
hBase
1. hbase简介 1.1. 什么是hbase HBASE是一个高可靠性、高性能、面向列、可伸缩的分布式存储系统,利用HBASE技术可在廉价PC Server上搭建起大规模结构化存储集群。 HBASE的目标是存储并处理大型的数据,更具体来说是仅需使用普通的硬件配置,就能够处理由成千上万的行和列所组 ...
分类:其他好文   时间:2017-07-22 15:42:10    阅读次数:223
深入理解C语言内存管理
之前在学Java的时候对于Java虚拟机中的内存分布有一定的了解,但是最近在看一些C,发现居然自己对于C语言的内存分配了解的太少。 问题不能拖,我这就来学习一下吧,争取一次搞定。 在任何程序设计环境及语言中,内存管理都十分重要。 这篇学习博客主要分为三个部分: 第一部分主要介绍内存管理基本概念,重点 ...
分类:编程语言   时间:2017-07-22 14:42:25    阅读次数:290
Gaussian LDA(1): LDA回想以及变分EM
Latent Dirichlet Allocation (LDA)是一个主题模型,可以对文本进行建模。得到文档的主题分布。经常使用的模型參数预计方法有Gibbs Sampling和Variational Inference,网上有许多关于LDA的介绍,最为经典的比如Rickjin的《LDA数学八卦》 ...
分类:其他好文   时间:2017-07-22 13:30:13    阅读次数:182
numpy.linspace使用详解
numpy.linspace(start, stop, num=50, endpoint=True, retstep=False, dtype=None) 在指定的间隔内返回均匀间隔的数字。 返回num均匀分布的样本,在[start, stop]。 这个区间的端点可以任意的被排除在外。 start  ...
分类:其他好文   时间:2017-07-22 13:21:53    阅读次数:240
拉开大变革序幕(下):分布式计算框架与大数据
由于对大数据处理的需求。使得我们不断扩展计算能力,集群计算的要求导致分布式计算框架的诞生。用便宜的集群计算资源在短短的时间内完毕以往数周甚至数月的执行等待,有人说谁掌握了庞大的数据。谁就主导了需求。尽管在十几年间,通过过去几十年的积淀,诞生了mapreduce。诞生了分布式文件系统。诞生了霸主级别的 ...
分类:其他好文   时间:2017-07-22 13:14:18    阅读次数:231
【转】Diamond -- 分布式配置中心
分布式系统中,配置文件繁多,如果规范不当,会导致维护困难而且极易出错。因此找了一款淘宝的统一配置中心来实现配置文件统一管理。确实方便了很多。 ...
分类:其他好文   时间:2017-07-22 12:08:59    阅读次数:155
机器学习中防止过拟合方法
过拟合 在进行数据挖掘或者机器学习模型建立的时候,因为在统计学习中,假设数据满足独立同分布,即当前已产生的数据可以对未来的数据进行推测与模拟,因此都是使用历史数据建立模型,即使用已经产生的数据去训练,然后使用该模型去拟合未来的数据。但是一般独立同分布的假设往往不成立,即数据的分布可能会发生变化(di ...
分类:其他好文   时间:2017-07-22 12:05:06    阅读次数:179
开源大数据引擎:Greenplum 数据库架构分析
Greenplum 数据库是最先进的分布式开源数据库技术,主要用来处理大规模的数据分析任务,包含数据仓库、商务智能(OLAP)和数据挖掘等。自2015年10月正式开源以来。受到国内外业内人士的广泛关注。本文就社区关心的Greenplum数据库技术架构进行介绍。 一. Greenplum数据库简单介绍 ...
分类:数据库   时间:2017-07-22 12:03:25    阅读次数:258
大型站点高并发架构技术
高并发: 高并发主要是由于网站PV访问量大,单台服务器涌承载大量访问所带来的压力,所以会采用多台服务器进行分流,采用服务器集群技术,对于每个访问会被 发送到哪台服务器,我们采取负载均衡策略,常见的技术有LVS,由于网站中有大量的静态页面,所以采用缓存服务器和反向代理技术,包括HAPROXY,Redi ...
分类:其他好文   时间:2017-07-22 12:01:53    阅读次数:204
© 2014 mamicode.com 版权所有  联系我们:gaon5@hotmail.com
迷上了代码!