专业的长沙网站优化公司

我们如何获得蜘蛛的芳心,增加爬取的频率

浏览:/ 2018-11-14

   目前主流的搜索引擎有:Baiduspider(百度蜘蛛的名字)、Googlebot(谷歌蜘蛛的名字)、360Spider(360好搜蜘蛛的名字)、Sogou News Spider(腾讯的搜狗蜘蛛的名字)、Yahoo! Slurp China”或者Yahoo(雅虎蜘蛛的名字)、YoudaoBot(有道蜘蛛的名字)等,可以把这些叫做网络蜘蛛,由它来抓取网络上的内容。

 
  下面以百度为例分享一下搜索引擎工作原理:
 
  一、抓取:
 
  搜索引擎主要作用是方便用户查找资料。想得到蜘蛛程序的优先抓取要保证服务器速度、页面路径尽量简短,缩小抓取深度,也可以用百度站长平台提交网址来加快蜘蛛抓取。注意:不希望被蜘蛛抓取的内容要做好robots协议。
 
  二、.过滤:
 
  搜索引擎抓取页面后会对所有内容进行过滤,以下内容会被过滤掉:
 
  1、无价值页面、匹配度及相关度不高的页面都会被过滤掉;
 
  2、死链接:随意删除文章后形成的死链接、随便更换网站路径形成的打不开的页面;
 
  3、欺骗页面:文不对题的页面;
 
  4、关键词堆砌的页面;
 
  5、垃圾外链。
 
  三、收录:
 
  一定要确保网页内容能被蜘蛛识别,才能利于收录,有收录才有排名,收录是保证排名的前提;有收录并不一定有排名。
 
  1、文字:文字是排名主题;
 
  2、图片:蜘蛛不能识别图片,要添加ALT属性,单只加ALT属性也不利于排名,文字太少,不专业。图片始终是辅助作用,一定要图文结合,文字很少时要加一些识别度高的关键词,切记:文字才是排名的主题;
 
  3、Flash:蜘蛛不能识别视频播放器和动画,一个网页最多放1~2个视频,必须放视频简介和评论,放蜘蛛不识别的内容的时候,文字必须是主体;
 
  4、JS:脚本特效,虽然炫酷,,但是蜘蛛不能识别。如:百度商桥、悬浮窗、对联广告等,新站不能放广告,有垃圾网站嫌疑,会延后排名。
 
1-1PQ6200141V0.jpg
 
  四、排序:
 
  蜘蛛执行完以上步聚即开始排序,要想有好的排名必须严格符合以上几条原则并灵活运用。 收录和排序的关系是包含关系,先收录才可以排序,即建立索引,收录量大于是索引量的。

阅读"我们如何获得蜘蛛的芳心,增加爬取的频率"的人还阅读

上一篇:都2018年了,你的seo优化技术有长进没?百度有多种算法

下一篇:网站权重为何物?如何提升网站权重?