简介awk是一个强大的文本分析工具,相对于grep的查找,sed的编辑,awk在其对数据分析并生成报告时,显得尤为强大。简单来说awk就是把文件逐行的读入,以空格为默认分隔符将每行切片,切开的部分再进行各种分析处理。awk有3个不同版本: 
awk、nawk和gawk,未作特别说明,一般指gawk,g...
                            
                            
                                分类:
系统相关   时间:
2014-05-23 05:24:57   
                                阅读次数:
435
                             
                    
                        
                            
                            
                                CAtlRegExp ClassCAtlRegExp 
类用于表示并处理正则表达式。模板类,定义如下:template class 
CAtlRegExp参数CharTraits字符特征对象.例如,默认的CAtlRECharTraitsA.摘要调用Parse方法设置正则表达式CAtlRegExp 
re;...
                            
                            
                                分类:
其他好文   时间:
2014-05-23 04:43:21   
                                阅读次数:
310
                             
                    
                        
                            
                            
                                Rewirte主要的功能就是实现URL的跳转和隐藏真实地址,基于Perl语言的正则表达式规范。平时帮助我们实现拟静态,拟目录,域名跳转,防止盗链等。本文将针对mod_rewrite和URL匹配的技术细节,以及RewriteCond与RewriteRule 指令格式进行探讨。
Rewirte模块内部处理
Rewirte模块的内部处理极为复杂,但是为了使一般用户避免犯低级错误,也让管理员能充分利用...
                            
                            
                                分类:
其他好文   时间:
2014-05-23 02:33:58   
                                阅读次数:
221
                             
                    
                        
                            
                            
                                常用的java正则表达式
正则表达式是编程中的一个难点和重点,下面就列举一些JAVA中常用的正则表达式大全。供大家共同学习。
 
1
整数或者小数:^[0-9]+\.{0,1}[0-9]{0,2}$
2
只能输入数字:"^[0-9]*$"。
3
只能输入n位的数字:"^\d{n}$"。
4
只能输入至少n位的数字:"^\d{n,}$"。
5
只能输入m~n位的数字:。"^\...
                            
                            
                                分类:
编程语言   时间:
2014-05-23 00:48:58   
                                阅读次数:
321
                             
                    
                        
                            
                            
                                import re
data = open('a.txt')
fh = open('b.txt', 'w')
"""Search the string begining with '【'"""
p = re.compile(r'\s*[\u3010]')
for each_d in data:
    if re.match('\s*3\d{4}', each_d):
   ...
                            
                            
                                分类:
编程语言   时间:
2014-05-22 17:26:17   
                                阅读次数:
293
                             
                    
                        
                            
                            
                                (?=exp)\w+ //匹配后面接着exp的\w+(?<=exp)\w+ 
//匹配前面是exp的\w+关键字:\ . = - ^ * + ( ) [ ] { } //(以后再补充吧)MSDN的regex类
                            
                            
                                分类:
其他好文   时间:
2014-05-22 14:22:19   
                                阅读次数:
218
                             
                    
                        
                            
                            
                                你是否曾经有过要计算一个非常大的数据(几百GB)的需求?或在里面搜索,或其它操作——一些无法并行的操作。数据专家们,我是在对你们说。你可能有一个4核或更多核的CPU,但我们合适的工具,例如 
grep, bzip2, wc, awk, sed等等,都是单线程的,只能使用一个CPU内核。借用卡通人物Ca...
                            
                            
                                分类:
系统相关   时间:
2014-05-21 23:53:33   
                                阅读次数:
618
                             
                    
                        
                            
                            
                                元字符元字符,如\b,.,*,还有\d. 正则表达式里还有更多的元字符,比如\s匹配任意的空白 
符,包括空格,制表符(Tab),换行符,中文全角空格等。\w匹配字母或数字或下划线或汉字等。对中文/汉字的特殊处理是由.Net提供的正则表达式引擎支持的,其它环境下的具体情况请查看 
相关文档。下面来看看更...
                            
                            
                                分类:
其他好文   时间:
2014-05-21 23:24:16   
                                阅读次数:
425
                             
                    
                        
                            
                            
                                最近闲来无事写了一个统计C或者C++代码行数的程序,主要用到了python以及正则表达式
#-*-coding:utf-8 
#!/usr/bin/python
import re 
import os
import sys
'''get the file or dir in one path'''
def getfilename(path):
    if os.path.exi...
                            
                            
                                分类:
编程语言   时间:
2014-05-21 15:06:30   
                                阅读次数:
379