码迷,mamicode.com
首页 >  
搜索关键字:碎片化 编码 索引 地图压缩    ( 65366个结果
Lucene中string docvalues使用utf-16的优化
原来的string docvalues使用utf-8编码,加载时转码花费大量时间,我们把转码实现从new String(bytes, "UTF-8")改用lucene的bytesRef.utf8ToString,减少了大约十秒的时间。 想进一步优化,我们使用UTF-16LE编码,解码非常简单甚至只需拷贝,如果用简单的byte[]到char[]转换,可以在节省7秒时间,而如果用unsafe可以节省...
分类:其他好文   时间:2014-05-25 01:46:44    阅读次数:246
【2】数字在数组中出现的次数
题目:统计一个数字k在排序数组中出现的次数。例如输入排序数组{1,2,3,3,3,3,4,5}和数字3,输出4次 方案一:扫描数组,记录第一个出现的k和最后一个k中间有多少个,时间复杂度为O(n) 方案二:由于数组是有序的,那么我们可以利用二分的思想,求出k在数组中的第一个位置和最后位置相减即可。时间复杂度为O(logN) 注意严格按照良好的C++编码风格 #include...
分类:其他好文   时间:2014-05-24 21:09:24    阅读次数:194
排序(二)键索引、桶排序、位示图、败者树等
排序(二) 以上排序算法都有一个性质:在排序的最终结果中,各元素的次序依赖于它们之间的比较。我们把这类排序算法称为比较排序。 任何比较排序的时间复杂度的下界是nlgn。   以下排序算法是用运算而不是比较来确定排序顺序的。因此下界nlgn对它们是不适用的。   键索引计数法(计数排序) 计数排序假设n个输入元素中的每一个都是在0到k区间的一个整数,其中k为某个整数...
分类:其他好文   时间:2014-05-24 20:26:16    阅读次数:273
排序(一)归并、快排、优先队列等
排序(一) 初级排序算法 选择排序 思想:首先,找到数组中最小的那个元素。其次,将它和数组的第一个元素交换位置。再次,在剩下的元素中找到最小的元素,将它与数组的第二个元素交换位置。如此往复,直到将整个数组排序。   【图例】 图中,x轴方向为数组的索引,y轴方向为待排序元素的值。   选择排序有两个很鲜明的特点: 运行时间和输入无关。为了找出最小的元素...
分类:其他好文   时间:2014-05-24 18:18:30    阅读次数:492
mysql基础操作、sql技巧和sql的常见优化
一、常见操作 1、复制表结构create table t2 like t1    复制表数据insert into t2 select * from t1 2、mysql索引    alter table用来创建普通索引、unique索引或primary key索引    alter table t add index index_name(column_list)    al...
分类:数据库   时间:2014-05-24 14:43:02    阅读次数:363
还是编码 汉字(GB2312和GBK)的ASCII码对照表
GB2312和GBK每一个汉字由2个字节组成,这2个字节的ASCII码大小分别是:gb2312:high8 = 0xa1-->0xfe (161 - 254)low8 = 0xa1-->0xfe (161 - 254)gbk:high8 = 0x80-->0xfe (128 - 254)low8 =...
分类:其他好文   时间:2014-05-24 13:15:27    阅读次数:330
语音交互技术——线性预测编码(LPC)
1.LPC基本概念:一个语音的抽样能够用过去若干个语音抽样的线性组合来逼近。通过使实际语音抽样和线性预测抽样之间差值的平方和达到最小,能够决定唯一的一组预测系数。用于语音分析与合成,可估计许多语音基本参数:基音、共振峰、频谱、声道截面积等。 2.线性预测编码框架: 模型的系统函数H(z)的三种形式:...
分类:其他好文   时间:2014-05-24 11:59:31    阅读次数:445
day20 在php中通过php语句操作数据库
第一步:连接数据库服务器mysql_connect("数据库服务器地址","用户名","密码")第二步:设定跟数据库打交道的网页的编码mysql_query("set names 编码名") //通常就是utf8第三步:设定要使用的数据库名:mysql_query("use 数据库名");第四步:执...
分类:数据库   时间:2014-05-24 11:39:01    阅读次数:262
MongoDB连接数与连接优化
默认每个连接数占用10M内存ulimit -a 查看stack sizeMongoDB服务器内存要满足 connection overhead + data size + index size即连接数开销+热点数据+索引连接数太多的问题:如果在日志中遇到类似如下的错误信息:"too many ope...
分类:数据库   时间:2014-05-24 11:18:25    阅读次数:378
中文分词器性能比较
本篇是本人在Solr的基础上,配置了中文分词器,并对其进行的性能测试总结,具体包括使用mmseg4j、IKAnalyzer、Ansj,分别从创建索引效果、创建索引性能、数据搜索效率等方面进行衡量。具体的Solr使用方法假设读者已有了基础,关于Solr的性能指标见前期的Solr博文。
分类:其他好文   时间:2014-05-24 09:33:03    阅读次数:371
© 2014 mamicode.com 版权所有  联系我们:gaon5@hotmail.com
迷上了代码!