内容目录:find 文件查找grep 文本搜索xargs 命令行参数转换sort 排序uniq 消除重复行用tr进行转换cut 按列切分文本paste 按列拼接文本wc 统计行和字符的工具sed 文本替换利器awk 数据流处理工具迭代文件中的行、单词和字符本文将介绍Linux下使用Shell处理文本...
分类:
系统相关 时间:
2015-08-01 17:06:57
阅读次数:
264
第8课 使用函数处理数据8.1 函数 【名词】可移植:所编写的代码可以在多个系统上运行8.2 使用函数8.2.1 文本处理函数 例1:使用 UPPER() 函数--将文本转换为大写SELECT vend_name, UPPER(vend_name) AS vend_name_upcaseFROM.....
分类:
数据库 时间:
2015-07-29 21:14:53
阅读次数:
199
一、前言 String.format作为文本处理工具,为我们提供强大而丰富的字符串格式化功能,为了不止步于简单调用String.format("Hello %s","John");,下面将笔记整理并记录下来。二、重载方法 ...
分类:
其他好文 时间:
2015-07-29 18:33:14
阅读次数:
102
<?php
/*GD库简介
GD指的是Graphic?Device,php的GD库是用来处理图形的扩展库,通过GD库提供的一系列API,可以对图像进行处理或者直接生成新的图片
php除了能进行文本处理以外,通过GD库,可以对JPG、PNG、GIF、S...
分类:
Web程序 时间:
2015-07-28 16:11:51
阅读次数:
135
正则表达式是一种强大而灵活的文本处理工具。使用正则表达式,我们能够以编程的方式,构造复杂的文本模式,并对输入的字符串进行搜索。找到匹配这些模式的部分就可以对它处理。正则表达式提供了一种完全通用的方式,能够解决各种字符串处理相关的问题:匹配、选择、编辑以及验证。1、基本语法字符:B ...
分类:
其他好文 时间:
2015-07-28 12:19:05
阅读次数:
91
Base64是一种用64个字符来表示任意二进制数据的方法。
用记事本打开exe、jpg、pdf这些文件时,我们都会看到一大堆乱码,因为二进制文件包含很多无法显示和打印的字符,所以,如果要让记事本这样的文本处理软件能处理二进制数据,就需要一个二进制到字符串的转换方法。Base64是一种最常见的二进制编码方法。
一、编码规则
所谓Base64,就是说选出64个字符----小写字母a-...
分类:
编程语言 时间:
2015-07-28 10:53:35
阅读次数:
772
这篇是计算机类的优质预售推荐>>>>《驾驭文本:文本的发现、组织和处理》
编辑推荐
本书适合于互联网文本内容处理领域的开发人员阅读,也适合有志于加入这一领域的学生、从业人员阅读。即使对于已经从事多年文本处理研究和开发工作的人员来说,本书也不失为一种有益的补充性读物。
内容简介
文本处理是目前互联网内容应用(如搜索引擎、推荐引擎)的关键技术。本书涵盖了文本处理概念和技术的...
分类:
其他好文 时间:
2015-07-27 18:58:47
阅读次数:
141
tr,awk,sed一:tr1.大小写转换cat file | tr [a-z] [A-Z] > new_file(大写 --> 小写)cat file | tr [A-Z] [a-z] > new_file2.删除空行cat file | tr -s "\n" > new_file二:awk:gs...
分类:
系统相关 时间:
2015-07-26 00:13:37
阅读次数:
191
原文:http://www.itongji.cn/article/06294DH015.html机器学习方法非常多,也很成熟。下面我挑几个说。首先是SVM。因为我做的文本处理比较多,所以比较熟悉SVM。SVM也叫支持向量机,其把数据映射到多维空间中以点的形式存在,然后找到能够分 类的最优超平面,最后...
分类:
其他好文 时间:
2015-07-25 16:39:14
阅读次数:
164
GD库简介
GD指的是Graphic Device,PHP的GD库是用来处理图形的扩展库,通过GD库提供的一系列API,可以对图像进行处理或者直接生成新的图片。
PHP除了能进行文本处理以外,通过GD库,可以对JPG、PNG、GIF、SWF等图片进行处理。GD库常用在图片加水印,验证码生成等方面。
PHP默认已经集成了GD库,只需要在安装的时候开启就行。
header(...
分类:
Web程序 时间:
2015-07-25 12:28:25
阅读次数:
127