SEO 百度的中文分词匹配技术

张玉淦 2010-01-26

目的是探测一下百度的中文分词匹配技术,百度对于搜索结果采用的是“与”逻辑,而且这个”与”逻辑在排名中应该有很高分值,由于是实验,为了加快收录,以取得更快的实验结果,我们对测试的三个页面加了些随机的文章,跟标题无关,外链方面都是均等的,都只有我这一个外链给它们,为了不影响标题的关键词匹配!同时也印证一下李彦宏所说的话。

以下为引用的内容:

记者:为什么对同一词条,百度与其他搜索引擎出来的结果不一样呢?
李彦宏:比如,在百度,检索词越长,用户找到的检索数目就越少。因为,我们认为用户检索的所有词语都应该出现,这样才能确保检索的精确性。但在谷歌或西方的搜索引擎,检索词越长,检索到的信息就越多。它们认为,与检索词中任一词语相关的信息都应该出现。换句话说,百度采用的是“与”逻辑,而谷歌或西方的搜索引擎采用的则是“或”逻辑。对用户来说,检索结果数量的多少并没有太大价值,最关键的是,他想要找的东西找到没有。

实验的第一个页面标题:李彦宏为什么吃饭?

实验的第二个页面标题:李彦宏为什么吃饭还要拿筷子?

实验的第三个页面标题:李彦宏为什么还要拿筷子吃饭?

实现前搜索结果:

SEO 百度的中文分词匹配技术

测试一小时后就收录了,当然结果也出来了。

试验后结果图片:

SEO 百度的中文分词匹配技术
李彦宏为什么吃饭还要拿筷子

SEO 百度的中文分词匹配技术
李彦宏为什么吃饭还要

SEO 百度的中文分词匹配技术
李彦宏为什么吃饭

SEO 百度的中文分词匹配技术
李彦宏吃饭

SEO 百度的中文分词匹配技术

SEO 百度的中文分词匹配技术

从试验后图片1中的结果可以看出,百度对完全匹配的检索词给予很高的分值,即使检索词的排序不同,只要这些词全部包含在页面中,都是可以加分的,这同样也能解析关键词堆砌对百度有用,而对google无用,了解了这些,也对大家做长尾关键词有个很好指导,而从以上四张图片中也验证了李彦宏所说的话:检索词越长,检索到的结果越少。大家有兴趣的自己可以再对比下google的结果,这就不难解析,为什么搜索一些词google的结果会多些了,两者的差异:百度采用的是“与”逻辑,而谷歌或西方的搜索引擎采用的则是“或”逻辑。

此实验并未考虑排名的其它因素(比如外链,网站权重,检索词出现的次数等),所以排名只能横向对比,就是看我的三个实验页面的结果进行对比。(现在大家应该知道李彦宏吃饭为什么用筷子了吧!)以上只是个人看法,也非常欢迎大家有不同的看法一起交流。

原文链接地址: http://www.1860z.com/1109.html  作者:叶松

相关推荐