这一节主要是关于抓取量的问题:
抓取量主要影响因素:
(1)网站安全
(2)文章质量
(3)响应速度
(4)主机支持的域名数量
同一个IP上如果有大站的话,可能会影响到你的网站抓取量。这个信息很重要。
野狼觉得这一节重要的信息:
1、一般正常的网站百度应该是可以当天抓取到。新网页、旧网页都会进行抓取。
2、同一个IP上如果有大站的话,会影响到你的站的抓取量。可以见得一个IP上可以承载的每日抓取量可能是在几十万级别(孙权说了个四十万,还有举例说了个一千万,所以可以说基本上一个ip可以承载十万级以上的)
3、被黑网站都会有记录。目前有40多万被黑过。