shimly00 2011-08-26
P4P的关键参数:
PV(pageView):页面浏览量,也就是流量。
CTR(clickthroughrate):点击率,一般的竞价排名都是按点击收费。
cov:覆盖率,页面中付费广告的比值。
PPC(payperclick):每次点击扣费,一般按照第二价格扣费,想了解详细可以搜索第二价格拍卖。
这些关键参数影响了竞价排名的收入。
说完了关键参数,接着介绍P4P的架构。
一般的P4P引擎由以下部分组成:
Blender:负责将外部查询语句改为内部查询语句(扩展加词,加密)。
Merger:负责分发,合并,排序,cache。
Searcher:提供索引查询服务,分词,排序。
Cm:负责blender,merge,search的调度;监听服务器load,cpu等参数。
Dispath&lsupdate:接受外部消息。
Click:记录,分析点击。
Fullbuild:从DB中dump数据,建立索引。
可以看出一般的p4p搜索引擎架构如下:
1定时通过爬虫/数据库获取数据,建立索引。
2实时获取数据,建立增量索引。
3用户输入查询信息。
4对用户的查询语句进行转化(扩展,加密等)
5通过负载均衡和分发服务分发给不同服务器。
6查询服务器进行分词,检索出结果,排序。
7合并服务对查询结果进行汇总,排序。
8监控服务负责对服务器进行监控。
9点击系统记录,分析用户点击信息。