最新消息:

标签:蜘蛛

如何正确识别Baiduspider
爬虫

如何正确识别Baiduspider

admin 10年前 (2014-06-26) 2594浏览 0评论

经常听到有人抱怨百度蜘蛛爬的太频繁导致服务器被跑挂了,大部分情况下那些不是真的百度蜘蛛,而是一些采集站点来爬内容,这里替百度觉得冤。辨别爬虫是否是百度的,不单单看主机头,毕竟浏览器头信息是可以伪造的,一般我们通过DNS反向解析能更好的判断当前IP是否...

减轻Bing爬虫MSNBot给网站造成的压力
Bind

减轻Bing爬虫MSNBot给网站造成的压力

admin 10年前 (2014-02-07) 3651浏览 0评论

最近某客户的VPS经常因为负载过高而无法访问。用ras-shell给VPS硬重启后过几十分钟就又因为负载高而无法访问了。 用netstat命令可以看到某些IP频繁访问网站的所有网页,给网站造成的压力很大。用host命令查看这些IP,可以看到这些IP都...