《中国新媒体发展报告(2014)》发布了一些新媒体的使用情况数据,25.6%无收入群体人数在玩微博,32.0%的微信用户属于月收入3000~5000元的中产阶层,那么土豪会玩什么新媒体呢?也许会是装有Yo的iWatch! Yo这款app只能收发“yo”这一个单词,它好比一个未接电话或一个警报,...
分类:
微信 时间:
2014-06-28 10:06:01
阅读次数:
366
匿名类是就就像这个词一样,是一个没有名字的类,看到这个匿名类有点迷糊了,如果大家想想一个类没有名称的话那么我们如何来使用他创建实例呢?答案就是我们可以使用 var 来声明一个匿名的类,创建的格式为: new anonymousClassName{字段1,字段2,........} 说明: ...
分类:
其他好文 时间:
2014-06-28 10:05:15
阅读次数:
133
引子 古人云:书非借不能读也。 现在IT书籍更新快、价格贵、质量水平更是参差不齐,实在不忍心看到用自己的血汗钱买的书不到半年就要被淘汰 更不想供养使用金山快译、词霸等现代化工具的翻译们。 于是去书店办了张借书卡,这样便没有了后顾之忧了——书不好我可以换嘛! 但是,借书也有不爽的地方,就是...
分类:
其他好文 时间:
2014-06-28 09:38:18
阅读次数:
324
1.引言
题目的意思应该是:在一个给定的字典中,求与给定的字符串的编辑距离不大于2的所有的单词。原先写过两片关于此问题的文章,那两片篇章文章给出两种解决思路:其一是暴力求解法,这种方法最容易想到。就是将词典中的词一一与给定的字符串计算编辑距离,不大于2的输出,大于2的舍弃,这种方法思路简单但是很费时间。其二根据词典中这些词之间的编辑距离建立一个以单词为节点的Trie树,遍历的...
分类:
其他好文 时间:
2014-06-27 23:31:21
阅读次数:
241
怎样从文本1中找出乱码词,在文本2中找出对应语句,在文本3中输出来:先建Win32控制台应用程序,再引入头文件:#include #include #include #include using namespace std;int _tmain(int argc, _TCHAR* argv[]){ ...
分类:
编程语言 时间:
2014-06-27 22:46:37
阅读次数:
313
【文章摘要】 对于由多个模块协同工作的软件来说,程序处理的时序是非常重要的。当消息处理的顺序出现混乱时,程序就会出现异常。 本文基于作者的实际项目经验,对软件模块之间的时序问题进行了详细的分析,为相关软件问题的分析及解决提供了有益的参考。【关键词】 C语言 时序 模块 开发 消息 一、问题描述 在某软件版本中,有两个模块(模块A与模块B)之间...
分类:
编程语言 时间:
2014-06-27 10:29:36
阅读次数:
254
#region 创建、跟新词库
///
/// 创建、跟新词库
///
private void CreateIndexData()
{
//索引库文件夹
FSDirectory dir = FSDirectory.Open(new DirectoryInfo(pat...
分类:
Web程序 时间:
2014-06-27 10:17:59
阅读次数:
232
基于Haar特征的Adaboost级联人脸检测分类器,简称haar分类器。通过这个算法的名字,我们可以看到这个算法其实包含了几个关键点:Haar特征、Adaboost、级联。理解了这三个词对该算法基本就掌握了。...
分类:
其他好文 时间:
2014-06-27 10:06:55
阅读次数:
334
elasticsearch本身的中文分词插件效果都不理想,手动添加词典可以在一定程度上进行弥补。
经过多次实验发现,mmseg的分词机制采用正向最长匹配算法,例如,针对“小时代”这个单词,其自带的词典中没有包含该词,故当用户搜索小时代时,检索不到任何结果。
在咸鱼老婆的虚心指导下,我终于找到了解决办法。
手动添加该词到mmseg的词库中,有两种方法:
1、将该词加入到自带的某个词典中(非停...
分类:
其他好文 时间:
2014-06-27 09:30:33
阅读次数:
232
目前分词性能比较差,只有1.65M/s,同事在没有改变主要算法的情况下做了一点优化调整,到3.52M/s,但对性能的提升仍然不够明显。我感觉亟须解决几个问题:
1.search时keyword分词也按多种粒度进行,然后分别sloppyphrase,最后or起来,由于大粒度分的词词频低,因此idf大,它们在排序时优先级更高,符合期望。现在只做一个粒度的切法,又要求在索引里面都能找到,感觉不太现实。...
分类:
其他好文 时间:
2014-06-27 07:07:34
阅读次数:
203