TF-IDF(term frequency–inverse document frequency)是一种用于资讯检索与资讯探勘的常用加权技术。TF-IDF是一种统计方法,用以评估一字词对于一个文件集或一个语料库中的其中一份文件的重要程度。字词的重要性随著它在文件中出现的次数成正比增加,但同时会随著它...
分类:
其他好文 时间:
2014-09-24 19:29:07
阅读次数:
208
TF-IDF算法是一种简单快捷的文档特征词抽取方法,通过统计文档中的词频来对文档进行主题分类。TF-IDF(term frequency–inverse document frequency)是一种统计方法,用以评估一字词对于一个文件集或一个语料库中的其中一份文件的重要程度。字词的重要性随着它在文件...
分类:
其他好文 时间:
2014-09-24 18:51:57
阅读次数:
252
1.TF-IDF2.基于语义的统计语言模型文章关键词提取基础件能够在全面把握文章的中心思想的基础上,提取出若干个代表文章语义内容的词汇或短语,相关结果可用于精化阅读、语义查询和快速匹配等。采用基于语义的统计语言模型,所处理的文档不受行业领域限制,且能够识别出最新出现的新词语,所输出的词语可以配以权重...
分类:
其他好文 时间:
2014-09-24 16:02:07
阅读次数:
165
在事务中有四个通用的原则是所有数据库都必须遵守的,简称ACID原则,下面简单概述一下oracle是怎样实现这四个原则的。
一. 原子性(Atomicity):一个事务要么全部执行,要么全部都不执行
在oracle中,当我们做一次变更的时候,系统会自动创建一条undo记录来描述怎样撤销这次变更。也就是说,当执行到一个事务的中间时,如果有其他用户想访问我...
分类:
数据库 时间:
2014-09-21 14:12:40
阅读次数:
236
TF-IDF(term frequency–inverse document frequency)是一种用于资讯检索与资讯探勘的常用加权技术。权重计算方法经常会和余弦相似度(cosine similarity)一同使用于向量空间模型中,用以判断两份文件之间的相似性。应用到余弦定理到新闻分类的算法模拟程序...
分类:
Web程序 时间:
2014-09-20 01:12:26
阅读次数:
370
这次活动一开始就买了一套E9+5寸TFT屏,应该是9月初吧。一直没有时间来玩,趁公司没有这么忙,就测试一下吧。这算是回馈一下天嵌吧,毕竟还是便宜了100块啊(PS:100块至少代表20只鸡腿啦。)
分类:
其他好文 时间:
2014-09-19 11:28:05
阅读次数:
181
这里只针对Edit的内容做一个简单的undo,redo功能;原理就是,将新增字符和相关信息添加到undo列表,在undo动作时,取记录信息,并在edit中删除新增的字符,然后将此动作添加到redo列表,以便恢复。本程序只对文本框文字的顺序增加做了处理,对于任意位置的删除,复制粘贴等没有进行处理,大家...
分类:
其他好文 时间:
2014-09-18 22:12:54
阅读次数:
229
【oracle11g,13】表空间管理2:undo表空间管理(调优) ,闪回原理...
分类:
数据库 时间:
2014-09-18 11:37:14
阅读次数:
403
普通堆表不足之处:表更新有日志开销 表删除有瑕疵 表记录太大检索较慢 索引回表读开销很大 有序插入难有序读出DELETE产生的undo最多,redo也最多,因为undo也需要redo保护全局临时表:1 高效删除记录 基于事务的全局临时表commit或者session连接退出后,自动删除 ...
分类:
数据库 时间:
2014-09-17 21:48:52
阅读次数:
477
实例恢复阶段:
1.数据文件不同步
2.前滚(重做redo)
3.文件中的提交和未提交数据
4.打开数据库
5.回退(还原undo)
6.文件中的提交数据
优化实例恢复:(加快脏数据的写)
使用 MTTR
fast_start_mttr_target (建议不要设置/增加系统负担)
db_writer_pricesses(DBWn的进程)
flashback;
...
分类:
数据库 时间:
2014-09-17 16:53:13
阅读次数:
255