上周,老大压下来任务,让写一个网络爬虫,负责爬某一个行业网站的数据信息。由于本人只会shell编程语言,其它编程语言从未涉猎,因此就只能硬着头皮用shell去写了。转眼之前已经过去一周了,一切从无到有,经历的坎坷无数,这里我就不一一吐槽。这里呢,我就简单和大家分享下..
分类:
其他好文 时间:
2014-09-11 09:45:02
阅读次数:
335
Awk 是一种非常好的语言,同时有一个非常奇怪的名称。在本系列(共三篇文章)的第一篇文章中,Daniel Robbins 将使您迅速掌握 awk 编程技巧。随着本系列的进展,将讨论更高级的主题,最后将演示一个真正的高级 awk 演示程序。 捍卫 awk 在本系列文章中,我将使您成为精通 awk 的编...
分类:
系统相关 时间:
2014-09-10 20:51:31
阅读次数:
278
引用shell变量year=`date+%Y`month=`date|awk‘{print$2}‘`awk-vy=$year-vm=$month‘BEGIN{FS="/";i=0}2==m&&$3==y{i++;$1=9999}END{printi}‘$logpath
分类:
其他好文 时间:
2014-09-10 19:47:51
阅读次数:
218
-v var=val --assign var=val Assign the value val to the variable var, before execution of the program begins. Suc...
分类:
其他好文 时间:
2014-09-09 17:56:49
阅读次数:
202
http://zh.wikipedia.org/wiki/AWK最简单地说,AWK是一种用于处理文本的编程语言工具只要在输入数据中有模式匹配,就执行一系列指令。该实用工具扫描文件中的每一行,查找与命令行中所给定内容相匹配的模式。如果发现匹配内容,则进行下一个编程步骤。如果找不到匹配内容,则继续处理下...
分类:
其他好文 时间:
2014-09-09 15:47:38
阅读次数:
179
1.netstatnetstat -tnl | grep 443 (查看443端口是否被占用)root用户,用netstat -pnl | grep 443 (还可显示出占用本机443端口的进程PID)。-a (all)显示所有选项,默认不显示LISTEN相关-t (tcp)仅显示tcp相关选项-u...
分类:
Web程序 时间:
2014-09-06 17:24:13
阅读次数:
349
一个还算可以的:[root@benet ~]# netstat -nlptu |awk '{print $4,$7}' | grep 80:::80 2508/httpd这样更直观的显示出要查询的端口以及使用这个端口的程序。感觉不是很赚准确:(并非所有进程都能被检测到,所有非本用户的进程信息将...
分类:
系统相关 时间:
2014-09-05 19:41:41
阅读次数:
220
shell编程中的字符串的截取方法:
一、Gnu Linux shell 截取字符变量的前8位,有方法如下:
1.expr substr “$a” 1 8
2.echo $a|awk ‘{print substr(,1,8)}’
3.echo $a|cut -c1-8
4.echo $
5.expr $a : ‘\(.\\).*’
6.echo $a|dd bs=1 count=8 ...
分类:
其他好文 时间:
2014-09-05 18:23:01
阅读次数:
214
这节详细介绍awk内置函数,主要分以下3种类似:算数函数、字符串函数、其它一般函数、时间函数一、算术函数:以下算术函数执行与 C 语言中名称相同的子例程相同的操作:函数名说明atan2( y, x )返回 y/x 的反正切。cos( x )返回 x 的余弦;x 是弧度。sin( x )返回 x 的正...
分类:
系统相关 时间:
2014-09-05 15:55:01
阅读次数:
323
在文件某一行上添加一列#awk实现
awk-va="add_chars"‘{print$0}/REGE/{print$0,a}‘file.txt
解释:-v:引入一个变量a,/REGE/:使用正则匹配一行
#sed实现
sed‘/REGE/{s/.&/&add_chars/g}‘file.txt
解释:/REGE/:匹配到正则REGE后进行替换动作
2.不同的..
分类:
其他好文 时间:
2014-09-05 03:26:51
阅读次数:
287