码迷,mamicode.com
首页 >  
搜索关键字:词    ( 36129个结果
poj4093:倒排索引查询
总时间限制: 1000ms 内存限制: 131072kB描述现在已经对一些文档求出了倒排索引,对于一些词得出了这些词在哪些文档中出现的列表。要求对于倒排索引实现一些简单的查询,即查询某些词同时出现,或者有些词出现有些词不出现的文档有哪些。输入第一行包含一个数N,1 #include #include...
分类:其他好文   时间:2014-07-19 15:31:50    阅读次数:121
linux终端快捷键
ctrl + u 撤销终端输入的长串命令ctrl + w 删除终端命令行最后一个单词
分类:系统相关   时间:2014-07-19 15:24:39    阅读次数:225
solrcloud和zookeeper的搭建、使用、心得、教训
公司的solr线上服务器,分成差不多是个core给不同的部门不同的业务需求来使用。我接手以来,问题多多,烦扰多多。有不少问题亟待解决,首当其冲的是搜索准确度、数据同步。搜索准确度已经通过改用ansj分词器和不断优化的个人词库和停用词库来解决,这是个不断优化的过程,需要长时间的跟进才有明显效果。第二个...
分类:其他好文   时间:2014-07-19 15:19:33    阅读次数:846
java读取中文分词工具(2)
/* * 文件格式:已分词的中文文本,每个词语空格分割,每行一个段落。 * 这个类适合读取每行数量较少的文本,比如分好段落的文本,一个段落一行存储。 * 读取一行,步长为1,返回词组。不会跨段落生成词组。 * 两种模式: * 1 读到文件末尾,结束 * 2 读到文件末尾,从头再来 */...
分类:编程语言   时间:2014-07-19 08:07:56    阅读次数:324
hdu 1251 字典树模板题 ---多串 查找单词出现次数
这道题题目里没有给定数据范围 我开了2005  疯狂的WA 然后开了50000, A掉  我以为自己模板理解错  然后一天没吃饭,饿得胃疼还是想着把这题A掉再去吃,谁知居然是这种问题,,,呵呵~~~ #include #include #include #include using namespace std; const int tk=26; const int t...
分类:其他好文   时间:2014-07-19 08:05:06    阅读次数:196
最大概率法分词中词频惩罚因子的作用探究
在最大概率法分词的程序中,由于每个词出现的次数分布非常不均匀,而且我们要计算每个词出现的概率,对于出现次数比较少的词概率就很小,求句子中词的概率之积的时候,需要将好多非常小的数作乘法,可能会将超出计算机所能表示的数的最小范围。为了便于计算,常常要将每个词的概率求对数后在进行计算,但是由于对概率求对数后变为负值,因此要求对应的相反数。所以一个词出现的次数越多,最后求得对应的值越小,我们将这个值称为这...
分类:其他好文   时间:2014-07-19 02:46:06    阅读次数:236
ZOJ 3430 Pizza schedule
题意: 给你一串编码后的单词和一篇文章 问 编码前文章中出现了几个单词 思路: 根据题意反编码 然后AC自动机跑一下 转化字符时候注意长度 因为可能转换出'\0' 所以转完后再求strlen会出错 注意 ZOJ的char默认是signed char 所以转码后要么存在unsigned char数组里 要么用int数组存 否则会错的!! 因为signed char无法表示128+的数字!!...
分类:其他好文   时间:2014-07-19 02:26:26    阅读次数:236
计算机英语 .NET英语单词 术语表1
action操作actionoriented面向操作AdaprogramminglanguageAda编程语言"administrative"sectionofthecomputer计算机的”管理“部分arithmeticandlogicunit算术逻辑单元(ALU)ARPAnet阿帕网assembler汇编器assemblylanguage汇编语言association关联attributeofaclass类的属性ban..
分类:Web程序   时间:2014-07-19 02:17:45    阅读次数:226
java读取中文分词工具
/* * 文本格式:已分词的中文文本,空格分割。有若干行,每行为一个段落。 * 功能:遍历文档,逐个返回词语。 * 两种模式: * 1 到文档末尾后,结束 * 2 到文档末尾后,从头再读。 /...
分类:编程语言   时间:2014-07-19 02:16:37    阅读次数:238
poj-2503-Babelfish
这个题需要用到字典树,那么什么是字典树呢? 百度一下就可知道了------>地址是:Trie树 我比较喜欢用数组来写字典树,我在这放了两张图片! 希望能帮助理解! 本题题意:是要求我们将某一个星球的单词翻译成对应的英语,如果有就输出对应的英文,没有就不输出! 思路:这个题先得用某一个星球的单词来建立一个字典树,然后再将对应单词“放”在叶子节点后面,可以将其比喻为有坠子的耳环!然后在翻译时直接查找即可!...
分类:其他好文   时间:2014-07-19 02:11:26    阅读次数:273
© 2014 mamicode.com 版权所有  联系我们:gaon5@hotmail.com
迷上了代码!