tf–idf算法解释tf–idf, 是term frequency–inverse document frequency的缩写,它通常用来衡量一个词对在一个语料库中对它所在的文档有多重要,常用在信息检索和文本挖掘中。一个很自然的想法是在一篇文档中词频越高的词对这篇文档越重要,但同时如果这个词又在非常...
分类:
编程语言 时间:
2015-12-23 21:12:25
阅读次数:
1036
一、针对raw_input输入的字符进行类型判断及转换: raw_input输入默认为字符,如果输入的是数字字符,想自动转换,即:输入为a,不做操作,如果输入为3,即转化为整数。 可利用try..except..的方法,让程序将raw_input()输入的值转换为int,如果输入的是...
分类:
编程语言 时间:
2015-12-23 00:33:20
阅读次数:
269
1、第一个Python代码在Linux下/home/zx 目录下新建hello.py文件1 #vim hello.py //添加如下内容2 3 #!/usr/bin/env python4 5 # -*- coding:utf-8 -*-6 print "Hello,World"7 8 #chm.....
分类:
编程语言 时间:
2015-12-19 11:05:10
阅读次数:
194
divmod(a,b)函数中文说明:divmod(a,b)方法返回的是a//b(除法取整)以及a对b的余数返回结果类型为tuple参数:a,b可以为数字(包括复数)版本:在python2.3版本之前不允许处理复数,这个大家要注意一下python代码实例:>>> divmod(9,2)(4, 1)>>...
分类:
其他好文 时间:
2015-12-17 22:12:13
阅读次数:
272
转自:http://in355hz.iteye.com/blog/1860787最近业务中需要用 Python 写一些脚本。尽管脚本的交互只是命令行 + 日志输出,但是为了让界面友好些,我还是决定用中文输出日志信息。很快,我就遇到了异常:Python代码UnicodeEncodeError:'asc...
分类:
编程语言 时间:
2015-12-16 21:33:24
阅读次数:
397
def classifyNB(vec2Classify, p0Vec, p1Vec, pClass1): p1 = sum(vec2Classify * p1Vec) + log(pClass1) p0 = sum(vec2Classify * p0Vec) + log(1.0 - pClass.....
分类:
编程语言 时间:
2015-12-15 21:13:38
阅读次数:
406
前言 图片或者文件夹下,命名不规范,有中文或者有空格。这个脚本批处理查找,并输出到 txt中方便修改,也可以扩展为直接脚本删除空格等。目前只用在Windows上,mac没有测试,不知道能不能行,有需要的话,自己修改一下吧。大神勿喷、、、、代码python代码如下:#coding=utf-8#201....
分类:
编程语言 时间:
2015-12-14 18:52:35
阅读次数:
232
对比了几个打包工具,发现py2exe更好用一点,一个命令就可以。1.获取http://prdownloads.sourceforge.net/py2exe 下载python版本对应的。直接下载然后安装可以2.python代码*新建个python项目,里面新建两个文件py2exe.py,main.py...
分类:
编程语言 时间:
2015-12-14 16:15:04
阅读次数:
176
复习 模块 模块支持从逻辑上组织Python代码。当代码量变得相当大的时候,我们最好把代码分成一些有组织的代码段,前提是保证他们的彼此交互。这些代码片段相互间有一定的联系,可能是一个包含数据成员和方法的类,也可能使一组相关但彼此独立的操作函数。这些代码段是共享的,所以Python允许“调入”一个模块...
分类:
其他好文 时间:
2015-12-12 01:30:18
阅读次数:
197
二、初始python1、第一句python代码>>> print 'hello world!!!'hello world!!!2、python解释器声明#!/usr/bin/env python3、编码以及编码声明# _*_ coding:utf-8 _*_4、注释单行注释#''' '''多行注释5...
分类:
其他好文 时间:
2015-12-08 21:50:42
阅读次数:
182