AWStats的补充定义区分百度图片搜索和一些新出现的流量较大蜘蛛
AWStats的补充定义:区分百度图片搜索和一些新出现的流量较大蜘蛛
作者:车东 发
于:2008-10-03 13:10 最后更新于:2008-10-03 13:10 版权声明:可以任意转载,转载时请务必以超链接形式标明文章原始出处和作者信息及本版权声明。
更新后的AWStats最新版本lib目录打包下载,蜘蛛定义部分增加了区分Yahoo!中国,Soso 豆瓣,鲜果等,其他的是几个国外的RSS阅读器;搜索引擎部分区分了百度图片,有道搜索,soso搜索; diff附后:
Index: robots.pm
===================================================================
RCS file: /cvsroot/awstats/awstats/wwwroot/cgi-bin/lib/robots.pm,v
retrieving revision 1.52
diff -r1.52 robots.pm
356a357
> 'yahoo!\sslurp\schina',
476a478
> 'soso',
677a680,688
> 'blogbus',
> 'QBikSpider',
> 'Zwl.Rss.Spider',
> 'BBReaderFeedSpider',
> 'yeti',
> 'doubanbot',
> 'moreoverbot',
> 'xianguo',
> 'blogvibebot',
997a1009
> 'yahoo!\sslurp\schina','
Yahoo! Slurp
China',
1114a1127
> 'soso','
Soso Spider',
1318a1332,1340
> 'blogbus','
BlogBus',
> 'QBikSpider','QBikSpider',
> 'Zwl.Rss.Spider','Zwl.Rss.Spider',
> 'BBReaderFeedSpider','BBReaderFeedSpider', > 'yeti','
Yeti',
> 'doubanbot','
doubanbot',
> 'moreoverbot','
Moreoverbot',
> 'xianguo','
XianGuo',
> 'blogvibebot','BlogVibeBot',
Index: search_engines.pm
===================================================================
RCS file:
bin/lib/search_engines.pm,v /cvsroot/awstats/awstats/wwwroot/cgi-
retrieving revision 1.45
diff -r1.45 search_engines.pm
287a288
> 'image\.baidu\.com', # baidu image search 295a297
> '\.youdao\.com', # powered by NetEase
501a504
> 'image\.baidu\.com','baidu_image', 506a510
> '\.youdao\.com','yodao',
765a770
> 'baidu_image','(wd|
)=',
771c776,777
< 'soso','q=',
---
> 'yodao','q=',
> 'soso','w=',
992a999
> 'baidu_image','
Baidu Image',
997a1005
> 'yodao', '
YoDao',
? 推荐《构建可扩展的Web站点》- 基于监控的系统调优 | (回到Blog入口)|(回到首页) | 增大AWStats的$LIMITFLUSH,减少磁盘临时文件读写 Flush history file on disk (unique url reach flush limit of 5000)
? [再编