- 帖子
- 32
- 积分
- 51
- 技术
- 0
- 捐助
- 0
- 注册时间
- 2013-7-26
|
4楼
发表于 2013-8-27 20:53
| 只看该作者
回复 3# DAIC
echo ●百度抓取网站404最多的5个频道(子域):
gawk "/Baiduspider/&&$9==404 {print $7}" log.log|gawk -F"/" "{print $1}"|sort|uniq -c|sort /r|head -5
echo ●百度抓取首页次数最多的5个域名:
@gawk "/Baiduspider/&&$7~/\.net\/$/ {print $7}" log.log|sort|uniq -c|sort /r|head -5
多谢,处理的是网站日志,有时上一条也会出现这种情况,大部分都是第二条出现。 |
|