商业P4P引擎架构

shimly00 2011-08-26

P4P的关键参数

PV(pageView):页面浏览量,也就是流量。

CTR(clickthroughrate):点击率,一般的竞价排名都是按点击收费。

cov:覆盖率,页面中付费广告的比值。

PPC(payperclick):每次点击扣费,一般按照第二价格扣费,想了解详细可以搜索第二价格拍卖。

这些关键参数影响了竞价排名的收入。

说完了关键参数,接着介绍P4P的架构。

一般的P4P引擎由以下部分组成:

Blender:负责将外部查询语句改为内部查询语句(扩展加词,加密)。

Merger:负责分发,合并,排序,cache。

Searcher:提供索引查询服务,分词,排序。

Cm:负责blender,merge,search的调度;监听服务器load,cpu等参数。

Dispath&lsupdate:接受外部消息。

Click:记录,分析点击。

Fullbuild:从DB中dump数据,建立索引。

可以看出一般的p4p搜索引擎架构如下:

1定时通过爬虫/数据库获取数据,建立索引。

2实时获取数据,建立增量索引。

3用户输入查询信息。

4对用户的查询语句进行转化(扩展,加密等)

5通过负载均衡和分发服务分发给不同服务器。

6查询服务器进行分词,检索出结果,排序。

7合并服务对查询结果进行汇总,排序。

8监控服务负责对服务器进行监控。

9点击系统记录,分析用户点击信息。

相关推荐