网站发布了呢么多的文章,为什么就是不收录你?今天小伟就给大家分享下关于网站收录的5大要素。
1、机器可读
以百度搜索引擎为例来说明,百度使用baiduspider程序来抓取网页,而他目前只能读懂网页中的文本信息。因此重要的内容,避免使用fiash、iframe、js、图片等方式展现重要的内容,以免影响正常收录。
2、网站结构
拥有清晰的导航:
且可以方便的抵达任何网页。建议页面结构不要超过三层。
如:首页>栏目页>详情页。通过首页可以方便抵达栏目页。而通过详情页,又能方便抵达首页。
使用面包屑导航:
方便用户了解到自己所在的位置,同时,也有利于站内网页之间互联,权重传递。
3、子域名及目录的选择
网页数量:
网页数量较少时。不建议采用二级域名,考虑直接采用一级目录,这样的好处是,可以继承到主域一定的权重,有利于收录。
内容相关性:
内容差别较大时,比如,当当最早是卖图书的,后来开拓了电脑销售频道,那么可以考虑使用二级域名。
4、url设定要求
url唯一性:
注意url的唯一性,即1个页面仅使用1个url访问。避免存在重复页面,最常见的是,同一个页面,动态url与静态url并存,再这样坏处是,分散权重。同事浪费蜘蛛抓取量。正常的做法,会将动态的url进行robots屏蔽,或301跳转至静态url。
避免多参数:
url样式简短美观,避免url中存在多个参数。多个参数会导致搜索引擎掉入黑洞的风险,从而影响搜索引擎对网站的正常抓取。
5、返回码设定
404:
404页面中存在失效或者不存在的页面,需要将页面状态码设为404.并在前段告诉用户该页面已失效。
301:
301当网站改版,原url发生变化时,需要使用301将旧的url301跳转向新版的url。以便继承权重,避免流量流失。