相似度计算的任务是根据两段输入文本的相似度返回从0到1之间的相似度值:完全不相似,则返回0,;完全相同,返回1.衡量两端文字距离的常用方法有:海明距离(Hamming distance),编辑距离,欧氏距离,文档向量的夹角余弦距离,最长公共字串。1. 余弦相似度把两篇文档看作是词的向量,如果x,y为...
分类:
其他好文 时间:
2014-07-22 22:53:35
阅读次数:
186
背景:目前公司某款互联网方向的产品已经有数十万活跃用户了,但是发现当我们确定下一步产品方向或者为产品添加某个功能,甚至衡量已经发布功能的使用情况时经常会用可能用户喜欢这样操作,可能用户在某时间段登陆比较多,可能用户的停留时间不长...这样的言语去猜测用户的行为..
分类:
其他好文 时间:
2014-07-20 23:38:23
阅读次数:
269
圈复杂度(Cyclomatic Complexity)是一种代码复杂度的衡量标准。它可以用来衡量一个模块判定结构的复杂程度,数量上表现为独立现行路径条数,也可理解为覆盖所有的可能情况最少使用的测试用例数。圈复杂度大说明程序代码的判断逻辑复杂,可能质量低且难于测试和维护。程序的可能错误和高的圈复杂度有...
分类:
其他好文 时间:
2014-07-18 19:37:29
阅读次数:
177
一份好的需求说明必须具备六个特性:正确性:每个需求必须精确描述要交付的功能;可行性:在已知的能力,优先的系统及其环境中每个需求必须能实现;必要性:每个需求应标明说明是客户确实需要的;优先权:每一个需求都应该能用一定的权重来衡量,不能所有需求都一样的重要。假设因其他因素必须砍掉一些需求的时候,要能从所...
分类:
其他好文 时间:
2014-07-16 21:44:18
阅读次数:
123
target...action设计模式 代理设计模式 手势识别器target...action设计模式耦合是衡量一个程序写的好坏的标准之一,耦合是衡量模块与模块之间关联程度的指标"高内聚,低耦合"是面向对象编程的核心思想
分类:
其他好文 时间:
2014-07-16 18:12:56
阅读次数:
228
QPS:Queries Per Second意思是“每秒查询率”,是一台服务器每秒能够相应的查询次数,是对一个特定的查询服务器在规定时间内所处理流量多少的衡量标准。TPS是 TransactionsPerSecond的缩写,也就是事务数/秒。它是软件测试结果的测量单位。一个事务是指一个客户机向服务器...
分类:
其他好文 时间:
2014-07-10 15:51:22
阅读次数:
180
衡量数据库状况, 优化数据库等当一个进程连接到数据库后, 进程所经历的种种等待就开始被记录, 并且通过一系列的性能视图进行展示, 通过等待事件用户可以很快发现数据库的性能瓶颈, 从而进行针对性能的优化和分析.v$event_nameoracle 等待事件主要分两类: 空闲等待(idle) 和 非空闲...
分类:
其他好文 时间:
2014-07-10 15:16:07
阅读次数:
162
l全文检索(Full-Text
Retrieval)是指以文本作为检索对象,找出含
有指定词汇的文本。全面、准确和快速是衡量全文检索系统的关键指
标。
l关于全文检索,我们要知道:
1,只处理文本。
2...
分类:
其他好文 时间:
2014-07-08 16:31:05
阅读次数:
183
转载请注明:电子科技大学EClab——落叶花开http://www.cnblogs.com/nlp-yekai/p/3816532.html困惑度一般在自然语言处理中用来衡量训练出的语言模型的好坏。在用LDA做主题和词聚类时,原作者D.Blei就是采用了困惑度来确定主题数量。文章中的公式为:perp...
分类:
编程语言 时间:
2014-07-02 18:03:38
阅读次数:
827
(一)如何衡量软件设计的质量
内聚度:
表示一个应用程序的单个单元所负责的任务数量和多样性。内聚与单个类或者单个方法单元相关。(好的软件设计应该做到高内聚。)
耦合度:
耦合度表示类之间关系的紧密程度。低耦合是指尽量使用抽象耦合,少用具体耦合。
设计原则名称
设计原则简介
重要性
单一职责原则
的职责要单一,不能将太多的职责放在一个...
分类:
其他好文 时间:
2014-06-30 20:08:23
阅读次数:
229