greatking 2010-07-09
关于搜索引擎为什么找不到你的页面的分析,我们现在系统地介绍让页面被搜索引擎收录的一些基本条件。而且很多人遇到的情况,几乎是一个整站没有任何页面被收录。网站被搜索引擎收录,一般需要满足如下几个因素中的至少一种。
a、 你的网站是著名网站,访问量非常大,业内非常著名。
如果你的站点真的是业内很出名的站点的话,你不要递交,或许搜索引擎都会想办法去收录他们。比如Yisou推出的第二天,就迅速地被各大搜索引擎收录了。
b、 你的页面向搜索引擎递交。
去各搜索引擎递交你的url,虽然不要被收录,而且需要等待一定的时间。但递交后至少增加了被收录的可能性。
百度递交:http://www.baidu.com/search/url_submit.htm
Google递交:http://www.google.com/intl/zh-CN/add_url.html
Yahoo递交:http://search.help.cn.yahoo.com/h4_4.html
Msn:递交:http://search.msn.com.cn/docs/submit.aspx?FORM=WSDD2
Sougou(搜狗) :http://db.sohu.com/regurl/regform.asp?Step=REGFORM&class=以我们常用的百度为例,来了解具体的登陆过程。
将你需要登陆的网站首页,也就是你的域名添入入口中,提交即可。有一点需要注意的是,一个站只用提交一次,无须重复提交,因为搜索引擎的抓取爬虫无论你怎么提交都是从首页开始抓取,所以与其重复的提交,还不如利用这些时间好好做你的网站呢:-)。
c、 其他页面有连接指向你的站点,并且这些页面在加上你的连接后被搜索引擎更新过。
首先必须说明,只考虑一个页面被搜索引擎收录而不是对排名有要求的话,不需要太多的连接。一般三五个好的经常被搜索引擎更新的连接就可以确保你的页面被收录了。
什么才是好的链接呢??PR值是一个重要的参考因素。还有一个重要的因素就是这个页面被搜索引擎更新的频率。 PR值可以查询得到,而更新频率可以通过cache命令查询最近一次更新的时间来估计。
d、 你的页面是值得收录的,此前所在站点或页面本身没有被搜索引擎惩罚而被拒绝收录过。
没有搜索引擎承诺一定会收录任何站点,相反都有各自的一些收录原则。如果你的站点涉及到搜索引擎反感的东西。那么可能站点内所有页面被搜索引擎拒绝收录。收录过的页面,如果涉及作×弊被搜索引擎删除后,一般也很难再被搜索引擎收录。
被搜索引擎惩罚的原因很多,而且对于一般站点,一惩罚可能会涉及到整个站点,而不是单单某一个页面了。一个新站,被搜索引擎拒绝收录的原因可能有:
1).你的网站不是跳转,不是指向URL. 即你必须确保你的网站被搜索引擎理解的首页是有真实的内容。
有很多的自助建站,和很多的博客都是采用了域名指向内页。这是很难收录的。当然也有可能你使用了Meta里的Refresh等标签。(更详细的你只有自己去查看SEO知识,石头不能在这里全部列举)
2).你的网站服务器域名空间设置有问题。
包括你的网站设置了错误的服务器信息,错误的robots协议等.或者在meta里面设置了Nofollow等属性。
3).你的网站使用了模板或跟别的网站镜向
由于很多网站使用了同样的摸板。造成了google不喜欢,当然这种情况更多问题是搜索出来的时候只有一个网址。还有些自助建站系统,本身就有致命的缺陷,阻止了Google的收录。
4).你的域名在注册前就已经被别人惩罚过。
这种情况你可以查看域名的包含页面。在你网站刚投入使用时,如果发现大量以前的包含页面,那说明你的域名已经是别人遗弃的,而且可能被搜索引擎惩罚过。如果你使用该域名很长时间还没有被收录,那最大的可能就是以前被惩罚过了e。你的页面被收录需要一定的时间。因为可能搜索引擎已经收录,只是还没有刷新搜索结果
一般而言,搜索引擎收录你的页面,到实际显示在搜索结果中,都是有一定的时间差的。以Google为例,这个时间差一般至少二天以上。通过 cache命令可以检查站点是否已被搜索引擎抓取及对应的时间。如果发现已经被抓取,他们只要耐心等待在搜索结果中出现就可以了
最近,一个名叫 Magi 的搜索引擎成了重点关注对象,据称这个搜索引擎和我们常见的搜索引擎很不一样,有一种程序员们钟爱的 X 冷淡风格。于是我们打开 Magi 看了看。确实,这个页面看着就很让人舒爽。