已排除页面中有以下几个类别:
- 已发现 – 尚未编入索引
- 如果发现 已发先,尚未编入索引
- 1. 你的URL有问题
- 一般使用robots.txt文件进行屏蔽
- 如果没有,则创建一个萝卜丝文件,写入对应屏蔽内容,通过FTP工具上传到网站根目录
- 2. 真的是还没有抓取
- 1. 你的URL有问题
- 如果发现 已发先,尚未编入索引
- 重复网页(无权威标记)
- 说明:权威标记 :canonical (谷歌官方文档,访问时需要科学上网。)
- <link rel=”canonical” href=”数据源头URL” />
- 备用网页(有适当的权威标记)
- 抓取异常
- 原因多样:其中主要因为服务器or网站问题导致搜索引擎再抓取时无法读取信息。
- 抓取异常中的链接需要逐个判断
- 最好的做法是:生成同样的URL页面,植入对应关键词,点击提交至索引。
- 已抓取 – 尚未编入索引
- 正常情况:搜索引擎真的还在抓你的页面
- 需要逐个手动打开判断
- 软 404
- 短空页面会被标注为 软404
- 统一做法:把所有的 软404页面 301至对应的有效索引页上
- 判断:搜索引擎结果是否有内容
- 如果当前短空页面可以修改,补全关键词&标题&内容,并且重新提交
- 网址已提交,但未被选为权威网址
- 注意:这些链接是否存在于你的网页当中,如果存在,删除链接or Nofollow(*不是删除网页)
- 未找到 (404)
- 网页会自动重定向(忽略)
发表回复
要发表评论,您必须先登录。