在做分类时常常需要估算不同样本之间的相似性度量(Similarity
Measurement),这时通常采用的方法就是计算样本间的“距离”(Distance)。采用什么样的方法计算距离是很讲究,甚至关系到分类的正确与否。
本文的目的就是对常用的相似性度量作一个总结。本文目录:1. 欧氏距离2. 曼....
分类:
其他好文 时间:
2014-07-22 23:15:15
阅读次数:
302
对《达芬奇密码(The Da Vinci
Code)》统计了各单词的出现次数。全书约12.5万字,出现了10240个单词,其中只有1559个单词出现了10次以上。详细结果在这里下载,可以用来背单词用。
分类:
其他好文 时间:
2014-07-22 23:15:15
阅读次数:
326
目前常用的json工具有:1、json-lib;2、jakson-mapper;3、fastjson。下面对这三种工具的性能进行简单对比测试。测试样本:一个126K的json文件,内容为json数组。测试方法:反序列化,读取文件中的json转化为java对象。测试代码如下:
1 @Test ...
分类:
Web程序 时间:
2014-07-22 23:15:13
阅读次数:
665
awk非常的优秀,运行效率高,而且代码简单,对格式化的文本处理能力超强。基本上grep和sed能干的活awk全部都能干,而且干得更好。先来一个很爽的例子:文件a,统计文件a的第一列中是浮点数的行的浮点数的平均值。用awk来实现只需要一句话就可以搞定(当然,这个东东用python也可以很轻松的实现,只...
分类:
其他好文 时间:
2014-07-22 23:15:12
阅读次数:
486
目的:本文描述怎么安装和配置一个单结点的Hadoop,以便搭建能快速简单操作和使用Hadoop的MapReduce和Hadoop的分布式文件系统(HDFS);先决条件:支持的平台GNU/Linux
可用作开发和生产平台. Hadoop 在GNU/Linux clusters with 2000 no...
分类:
其他好文 时间:
2014-07-22 23:14:55
阅读次数:
435
SE24
CL_EXITHANDLER的方法GET_INSTANCE中有基本上所有的增强都会走这边,打上断点查找增强名称,或者在程序中全局搜索GET_INSTANCE关键字然后
SE19 下 class badi 下的badi名称输入,创建badi实现,code增强业务逻辑
分类:
其他好文 时间:
2014-07-22 23:14:55
阅读次数:
275
#-*- coding: cp936 -*- #首行加这个
代码里就可以加注释raw_input("Press Enter Exit") #最后一行加这个,可以直接点击脚本运行脚本l[a:b] = [c]
#即用右边的[c]完全替换a到b-1个元素http://www.cnblogs.com/zhe...
分类:
编程语言 时间:
2014-07-22 23:14:54
阅读次数:
369
用shell写了个递归遍历目录的脚本,本脚本实现递归遍历指定目录,打印目录下的文件名(全路径)。#!/bin/sh function scandir() {
local cur_dir parent_dir workdir workdir=$1 cd ${workdir} if [ ${w...
分类:
其他好文 时间:
2014-07-22 23:14:53
阅读次数:
563
一、编写思路
手机端为客户端,PC为服务端,手机访问PC通信,需建立一个虚拟的通信链路,客户端通过socket发送请求到服务端,服务端通过serversocket监听来自客户端的socket请求,并生成一个socket。这样就建立了一条虚拟通信网络,然后再通过相关方法进行通信。项目需在服务端建立一个...
分类:
移动开发 时间:
2014-07-22 23:14:52
阅读次数:
489
有时候服务器上并没有安装任何IDE或典型的代码编辑器,只能完全手写C#代码。不妨假设一台全新的PC,较新版本的Windows自带了.net框架,无需开发工具即可编程了。除了以往的Bat批处理、VBS脚本,以及利用浏览器支持编写简单的程序,连C#、VB.net等编译型语言也可以直接开发了。设置环境变量...
分类:
其他好文 时间:
2014-07-22 23:14:35
阅读次数:
421