码迷,mamicode.com
首页 >  
搜索关键字:lucene 检索    ( 9316个结果
互联网技术
互联网技术定义:互联网技术指在计算机技术的基础上开发建立的一种信息技术(Information Technology 简称 IT) 直译 internet Technology 简称 IT概念范围第一层是硬件,主要指数据存储、处理和传输的主机和网络通信设备;第二层是指软件,包括可用来搜集、存储、检索...
分类:其他好文   时间:2014-05-12 17:45:06    阅读次数:388
视图
视图(View)实际上是一张或者多张表上的预定义查询,这些表称为基表。从视图中查询信息与从表中查询信息的方法完全相同。只需要简单的 SELECT…FROM 即可。视图具有以下优点:1. 可以限制用户只能通过视图检索数据。这样就可以对最终用户屏蔽建表时底层的基表。2. 可以将复杂的查询保存为视图。.....
分类:其他好文   时间:2014-05-05 22:38:28    阅读次数:332
Mahout安装
在Hadoop集群环境下安装Mahout。环境:OS:Centos 6.5 x64 & Soft:Hadoop 1.2.1 & Mahout 0.91、简介mahout项目主页:https://mahout.apache.org/下载二进制包,上传到服务器。2、安装用集群环境用户安装,解压二进制包。...
分类:其他好文   时间:2014-05-05 21:35:23    阅读次数:429
数据库Hash索引
Hash 索引结构的特殊性,其检索效率非常高,索引的检索可以一次定位,不像B-Tree 索引需要从根节点到枝节点,最后才能访问到页节点这样多次的IO访问,所以 Hash 索引的查询效率要远高于 B-Tree 索引。虽然 Hash 索引效率高,但是 Hash 索引本身由于其特殊性也带来了很多限制和弊端...
分类:数据库   时间:2014-05-03 22:34:01    阅读次数:369
百度技术沙龙 - 大数据场景下主题检索应用
第48期百度技术沙龙上的《大数据场景下主题检索应用》讲座介绍了很多训练大规模主题模型的技术细节。讲座回来后,我粗略整理了下讲座上涉及的主题模型和训练大规模模型相关的资料和文献。 1. 主题模型的发展历史     a. 布尔模型 Boolean model     b. 向量空间模型 VSM (Vector space model)     c. 潜在语义索引 LSI (Latent...
分类:其他好文   时间:2014-05-03 21:40:07    阅读次数:371
支撑5亿用户、1.5亿活跃用户的Twitter最新架构详解及相关实现
Twitter出道之初只是个奋斗在RoR上的小站点,而如今已拥有1.5亿的活跃用户,系统日传输tweet更多达4亿条,并已完成了以服务为核心的系统架构蜕变。 Twitter如今在世界范围内已拥有1.5亿的活跃用户,为了给用户生成timeline(时间轴)需支撑30万QPS,其firehose每秒同样生成22MB数据。整个系统每天传输tweet 4亿条,并且只需要5分钟就可以让一条tweet从Lady Gaga手中呈现到她3100万粉丝的屏幕上。当下Twitter系统的规模及强大的吞吐量确实惹人艳羡,然而在出...
分类:其他好文   时间:2014-05-03 16:49:26    阅读次数:361
如何在 javascript / js 中 建立一个map
建立map的方式(其实用的是json实现方式) var a = {}; a["key1"] = "value1"; a["key2"] = "value2"; 既然是个map就有检索某个键是否存在的方法,这样写 if ("key1" in a) { // something } else { // something else } 简单的一句话声明map里面的key和valu...
分类:编程语言   时间:2014-05-02 19:21:46    阅读次数:332
支撑5亿用户、1.5亿活跃用户的Twitter最新架构详解及相关实现
如果你对项目管理、系统架构有兴趣,请加微信订阅号“softjg”,加入这个PM、架构师的大家庭 摘要:Twitter出道之初只是个奋斗在RoR上的小站点,而如今已拥有1.5亿的活跃用户,系统日传输tweet更多达4亿条,并已完成了以服务为核心的系统架构蜕变。 Twitter如今在世界范围内已拥有1....
分类:其他好文   时间:2014-05-02 13:46:05    阅读次数:375
Lucene 4.8.0 发布了,变化一如既往的大,新特性一一解读
Lucene 4.8.0 发布了,变化一如既往的大,新特性一一解读。10年之前,你是1.0; 10年之后,你是4.8 。放在10年这个时间跨度上看,也许变化就没那么大了。...
分类:其他好文   时间:2014-05-01 17:30:16    阅读次数:364
用hadoop实现SimRank++算法(1)----权值转移矩阵的计算
本文主要针对广告检索领域的查询重写应用,根据查询-广告点击二部图,在MapReduce框架上实现SimRank++算法,关于SimRank++算法的背景和原理请参看前一篇文章《基于MapReduce的SimRank++算法研究与实现》。 SimRank++的矩阵形式的计算公式为: 算法主要步骤如下: Step1: 计算权值矩阵,并获取最大Query编号和最大广告编号; Step2:...
分类:其他好文   时间:2014-05-01 08:21:53    阅读次数:527
© 2014 mamicode.com 版权所有  联系我们:gaon5@hotmail.com
迷上了代码!