原来的string docvalues使用utf-8编码,加载时转码花费大量时间,我们把转码实现从new String(bytes, "UTF-8")改用lucene的bytesRef.utf8ToString,减少了大约十秒的时间。
想进一步优化,我们使用UTF-16LE编码,解码非常简单甚至只需拷贝,如果用简单的byte[]到char[]转换,可以在节省7秒时间,而如果用unsafe可以节省...
分类:
其他好文 时间:
2014-05-25 01:46:44
阅读次数:
246
题目:统计一个数字k在排序数组中出现的次数。例如输入排序数组{1,2,3,3,3,3,4,5}和数字3,输出4次
方案一:扫描数组,记录第一个出现的k和最后一个k中间有多少个,时间复杂度为O(n)
方案二:由于数组是有序的,那么我们可以利用二分的思想,求出k在数组中的第一个位置和最后位置相减即可。时间复杂度为O(logN)
注意严格按照良好的C++编码风格
#include...
分类:
其他好文 时间:
2014-05-24 21:09:24
阅读次数:
194
排序(二)
以上排序算法都有一个性质:在排序的最终结果中,各元素的次序依赖于它们之间的比较。我们把这类排序算法称为比较排序。
任何比较排序的时间复杂度的下界是nlgn。
以下排序算法是用运算而不是比较来确定排序顺序的。因此下界nlgn对它们是不适用的。
键索引计数法(计数排序)
计数排序假设n个输入元素中的每一个都是在0到k区间的一个整数,其中k为某个整数...
分类:
其他好文 时间:
2014-05-24 20:26:16
阅读次数:
273
排序(一)
初级排序算法
选择排序
思想:首先,找到数组中最小的那个元素。其次,将它和数组的第一个元素交换位置。再次,在剩下的元素中找到最小的元素,将它与数组的第二个元素交换位置。如此往复,直到将整个数组排序。
【图例】
图中,x轴方向为数组的索引,y轴方向为待排序元素的值。
选择排序有两个很鲜明的特点:
运行时间和输入无关。为了找出最小的元素...
分类:
其他好文 时间:
2014-05-24 18:18:30
阅读次数:
492
一、常见操作
1、复制表结构create table t2 like t1
复制表数据insert into t2 select * from t1
2、mysql索引
alter table用来创建普通索引、unique索引或primary key索引
alter table t add index index_name(column_list)
al...
分类:
数据库 时间:
2014-05-24 14:43:02
阅读次数:
363
GB2312和GBK每一个汉字由2个字节组成,这2个字节的ASCII码大小分别是:gb2312:high8
= 0xa1-->0xfe (161 - 254)low8 = 0xa1-->0xfe (161 - 254)gbk:high8 =
0x80-->0xfe (128 - 254)low8 =...
分类:
其他好文 时间:
2014-05-24 13:15:27
阅读次数:
330
1.LPC基本概念:一个语音的抽样能够用过去若干个语音抽样的线性组合来逼近。通过使实际语音抽样和线性预测抽样之间差值的平方和达到最小,能够决定唯一的一组预测系数。用于语音分析与合成,可估计许多语音基本参数:基音、共振峰、频谱、声道截面积等。
2.线性预测编码框架: 模型的系统函数H(z)的三种形式:...
分类:
其他好文 时间:
2014-05-24 11:59:31
阅读次数:
445
第一步:连接数据库服务器mysql_connect("数据库服务器地址","用户名","密码")第二步:设定跟数据库打交道的网页的编码mysql_query("set
names 编码名") //通常就是utf8第三步:设定要使用的数据库名:mysql_query("use 数据库名");第四步:执...
分类:
数据库 时间:
2014-05-24 11:39:01
阅读次数:
262
默认每个连接数占用10M内存ulimit -a 查看stack
sizeMongoDB服务器内存要满足 connection overhead + data size + index
size即连接数开销+热点数据+索引连接数太多的问题:如果在日志中遇到类似如下的错误信息:"too many ope...
分类:
数据库 时间:
2014-05-24 11:18:25
阅读次数:
378
本篇是本人在Solr的基础上,配置了中文分词器,并对其进行的性能测试总结,具体包括使用mmseg4j、IKAnalyzer、Ansj,分别从创建索引效果、创建索引性能、数据搜索效率等方面进行衡量。具体的Solr使用方法假设读者已有了基础,关于Solr的性能指标见前期的Solr博文。
分类:
其他好文 时间:
2014-05-24 09:33:03
阅读次数:
371