关于编写微博锐推机器人的吐槽。

robotxm 2012-05-28

周末看到新浪和腾讯上缺乏类似rtmeme/rtfocus之类的锐推机器人,以前在饭否上写过饭否小字报,就想看看能否为这些微博平台写一个,后来发现,不是别人不愿意写,而是国内的微博太奇葩了,没有适合这类机器人生存的小土壤也。

先上新浪微博平台,申请了应用,发现要上线得用oauth2认证,宣称oauth2认证更简单,于是把代码从oauth1改成oauth2,期间各种文档中没有提及却遇到的问题就不说了,新浪的oauth2access_token竟然有expire而没有refresh_token,而且一天一过时(貌似应用审核后的是七天一过期)!这意味着每天要手动重新授权一次才能保持机器人起码的工作,每天要手动重启的还能叫机器人吗?

于是转到腾讯微博,腾讯微博的开发接口倒是稳定,采用oauth1授权,很快就搞定了,等机器人跑起来,这才发现,腾讯微博的活跃率比新浪微博低无数倍啊无数倍(这也许是新浪微博如此强势也是有凭借的)。follow一百多个人,一天下来只有5,6个人回fo. 推广不开一切都免谈。让其跑着也算惨淡经营吧。地址在http://t.qq.com/wehuibao求佛。

总结下经验教训,国内微博广告和spam用户太多,机器人实现初期锐推的一大部分是广告用户,跑着广告,为了真实起见不得不把所有带链接的消息都不转。虚假用户的微博,他们公布的统计,流量数字真的有价值吗?

锐推机器人的算法基本原理,参照redit,rtmeme等实现原理的公开文档。就是一个简单的公式。

一条消息的价值 = C * (投票数:评论和转发数目) + 消息创建时间

C是一个常数,通常根据经验可以调整,C大,则投票数更有效,更加稳定,只管的表现是机器人推荐的消息频率低, 而C变小是,机器人推荐消息的频率高,经常有新的内容。

相关推荐