REST与Web2.0(四):使用 Twitter REST API

ydx 2011-01-08

简介:

Twitter无疑是WorldWideWeb上新近出现的最为成功的一个社交网站的例子。Twitter提供了一个API以便Web开发人员能够使其用户访问到Twitter站点所能提供的各种特性。在本文中,了解使用TwitterRESTAPI的基本知识。

Twitter是一个简单的基于Web的方式,用最多140个字符告知某些人您目前正在做的事情。

这是最为简短的定义。

较长的定义则稍微复杂一些,加入了更多价值考虑。Twitter是如今业界公认的最为成功的一种社交媒介、在线社交网络,即Web2.0。使用Twitter,您可以聚集大量跟随者。然后,您就可以不时地告诉他们您目前从事的事情。您在TwitterGUI内键入一个简短的故事(即业界所称的tweet)并单击按钮,该tweet随后就会被传输给所有您的跟随者,他们可以相应地选择阅读、了解、回复或忽略

莎士比亚曾告诉我们说“言以简洁为贵”。这一哲学得到了Twitter权威人士很好的贯彻,比如tweet就被限制为最长140个字母。实际上,这一限制与莎士比亚完全无关:它应该与Twitter刚开发出来时移动设备的局限性有关。但该限制很受欢迎,因为它有效防止了tweet内不必要的垃圾信息和措辞混乱。

虽然tweet的长度被严格限制,但这些tweet的实际内容并未受限制。Twitter的初衷是为了告诉您的追随者您现在所做的事情。每天有数百万的tweet发布,毋庸置疑,其主题并不可能总是一成不变的。人们会发布意见、头条、对其blog的链接、对他人blog的链接等等。所以Twitter的新用户应该准备好收到与tweeter的当前所从事的事情毫不相关的tweet。

与大多数(如果不是全部)的Web2.0一样,Twitter还具有一个额外的好处:它是免费的。没错,您无需任何成本就可以加入,无需任何成本就可以追随别人,无需任何成本就可以有任意数量的追随者,无需任何成本就可以tweet。它完全听凭您随意使用。

现在,您应该对Twitter及其功能有了一个很宽泛的认识。如果您尚未访问过Twitter站点,在进行本文其余部分的阅读之前,不妨先浏览一下该站点。这样一来,就更容易理解RESTAPI。

TwitterRESTAPI

了解了基础知识之后,就可以开始研究Web应用程序开发人员所感兴趣的东西了。Twitter不仅仅是社交媒介领域一种很有用的工具,它还能够为开发人员提供一整套的服务来启用Twitter功能的自动化。这些服务之一(并且也有可能是最为流行的一种服务)就是RESTAPI。

REST是RepresentationalStateTransfer的缩略语。对REST定义的详细和完整解读超出了本文的范畴;不过,在IBM®developerWorks®(参见参考资料)的其他地方可以找到相关信息。对于这里所要涵盖的主题,只需知道REST的作用是让开发人员通过一个简单的HTTP调用就可以访问信息和资源,这就足够了。

举个例子,假设FishinHole.com运营了一个向其客户销售钓鱼用具的Web站点。访问该站点的用户可以看到各种鱼饵、渔线和鱼竿等。顾客用老的方式操作:通过单击链接。以这种方式,FishinHole.com可以将其服务提供给客户。

但是FishinHole.com还通过用REST公开其渔具的产品目录的方式将其服务提供给了其他的Web应用程序。所以,与胡乱单击不同,Web应用程序通过一个简单的HTTP调用就可获得有关鱼饵、渔线和鱼竿等的信息。比如,http://www.fishinhole.com/catalog/rest/lures?format=xml可以以XML格式返回该公司所提供的所有鱼饵的列表。又比如,http://www.fishinhole.com/catalog/rest/item?id=343221可以以默认格式返回条目#343221的相关信息。

不妨以这种方式来思考REST:通过将一个URL指向一个特定的位置即可获得特定于域的数据。对于本文的目的而言,这就是全部了。也可以将它想象为一种简化了的Web服务,但是如果您找错了人,在其面前对此高谈阔论,则很可能会陷入到辩论当中。

注意:我应该指出的是FishinHole.com并不实际存在。所以,如果把这些URL粘贴到浏览器中,很有可能会遇到错误。我之所以提供这些例子,只是为了向您展示一个典型的REST调用的格式。

您想不想看到一个完全可以工作的RESTAPI的例子?一个您可以将其中的URL粘贴到浏览器中并返回一些有益信息的例子?那么就请继续阅读本文吧。

立即开始:一个简单的例子

您刚刚阅读完JoelComm的杰作TwitterPower,并决定今天就开始用Twitter通过一个积极主动的在线营销活动获得财政上的独立性。

但是您同时还是一个很棒的软件开发人员。这意味着您更愿意让软件为您完成大部分工作,而不用自己亲历亲为。您不仅要注册一个新的Twitter帐号,而且还要开始学习API以便可以自动化Twitter功能的某些方面。

您第一件想做的事情就是使用此API来检索JoelComm的时间表(参见清单1)。这很有意义,因为他写过一本让您如此备受启发的书籍。

清单1.检索JoelComm的时间表

http://twitter.com/statuses/user_timeline.xml?id=joelcomm

就这么简单。打开另一个浏览器,将该URL粘贴到地址栏,然后等待结果。

显然,对该REST调用进行更深入的探讨是很必要的。首先,http://twitter.com前缀应该是自说明的。twitter.com部分是域名,表明了将要访问位于该名字所映射到的IP地址的一个资源。它前面的http表明将要使用超文本传输协议。这也是REST的常见情况。

接下来,是/statuses。这表明Twitter是如何在一个特定类别指定REST函数的。可以将它想象为文件系统内的一个目录。在本例中,被调用的REST函数被分类在statuses下。在Twitter术语中,一个用户状态基本上也就是一个tweet,因为它表明的恰是用户现在正在做的事情。

再下来是user_timeline。这是所调用函数的实际名称。将此函数直观地命名为user_timeline,因为实际上,检索的是一个用户时间表或用户最近输入的一系列tweet。

请不要忘掉此函数名后的.xml扩展名:这非常重要。它是检索时间表所采取的格式。这里,使用的是XML。其他的可用格式为Java™SimpleObjectNotation(JSON)、Atom和RSS。

使用标准GET注释,参数紧随函数,并由问号(?)分隔。在本例中,只有一个参数—id—而且它指定了您想要查看其时间表的那个用户的Twitter名。这里,指定了joelcomm,因为您想查看的就是他的时间表。

评估输出

查看了上述调用的输出后,您发现您更愿意收到Atom格式的结果。所幸的是,这不成问题,只需对清单1中的代码做一个很小的更改(清单2)即可。

清单2.以Atom格式检索JoelComm的时间表

http://twitter.com/statuses/user_timeline.atom?id=joelcomm

上述REST调用所产生的结果类似于清单3。如果您将该代码粘贴到您的URL,您的浏览器可能会要求您下载结果,因为您的浏览器并未被配置成能够显示以.atom扩展名结尾的文件。

很显然,Joel的时间表在本文发表之际(和您阅读本文之际)与在我撰写本文的时侯不一样。所以,得到的结果也会大相径庭。

清单3.Atom格式的JoelComm时间表(节选)

<?xml version="1.0" encoding="UTF-8"?>
<feed xml:lang="en-US" xmlns="http://www.w3.org/2005/Atom">
  <title>Twitter / joelcomm</title>
  <id>tag:twitter.com,2007:Status</id>
  <link type="text/html" rel="alternate" href="http://twitter.com/joelcomm"/>
  <updated>2009-03-22T10:21:31+00:00</updated>
  <subtitle>Twitter updates from Joel Comm / joelcomm.</subtitle>
    <entry>
      <title>joelcomm: thinking...</title>
      <content type="html">joelcomm: thinking...</content>
      <id>tag:twitter.com,2007:http://twitter.com/joelcomm/statuses/1369295498</id>
      <published>2009-03-22T05:15:01+00:00</published>
      <updated>2009-03-22T05:15:01+00:00</updated>
      <link type="text/html" rel="alternate" 
	 href="http://twitter.com/joelcomm/statuses/1369295498"/>
      <link type="image/jpeg" rel="image" 
		href="http://s3.amazonaws.com/joel1_normal.jpg"/>
      <author>
        <name>Joel Comm</name>
        <uri>http://www.JoelComm.com</uri>
      </author>
    </entry>
</feed>

如果您熟悉XML,就会发现清单3的大部分都很直观。如果您熟悉Atom,更会发现它丝毫不陌生。如果您既熟悉Atom又熟悉Twitter,您完全可以跳过这一章节。

以下是对清单3内的代码的分项描述:

请注意根元素是feed。根据Atom规范,这很标准。Twitter使用的名称空间是http://www.w3.org/2005/Atom,被指定为根目录内的一个属性。

title元素代表的是您正在查看哪个用户的时间表。它还为Twitter网站做了一点广告宣传。

link元素也很重要:它指定了若以老的方式查看(在浏览器手动查看)JoelComm的时间表应该使用的那个URL。

entrystanza代表的是一个tweet。虽然出于简单的目的,我只列出了一个,但实际上,在输出中可以看到20个这样的tweet。

请注意title和content的实际内容是一样的。这是因为tweet没有标题,所以标题也就是实际tweet本身。还记得么,Atom的设计初衷就是为了用于文章型文档,这类文档通常具有一个大标题,然后就是主体部分。由于tweet并不如此,所以两个元素包含了一模一样的内容。

在Atom格式,内容之前是Twitter名,然后是一个冒号(:)。这里,joelcomm:在实际的tweet之前。

这里的实际tweet是一个美妙无比的语句thinking...。这是我在写作本文之时Joel最新的tweet。挑剔的人可能会据此判断这说明Joel有的时候没有思考或者Joel缺乏有关其最新tweet的资料,因此才会不得已随便输入了些东西。不过,我并未把别人的这类猜测放在心上。

id元素是Atom必需的,并且是这个特定的tweet的一个全局惟一的标识符(GUID)。Twitter在世界范围内的所有tweet均具有惟一ID以便它们能被惟一引用。

published和updated(出版和更新)的日期和时间也是相同的。这没错,因为Joel仅仅输入了其tweet,从未更新过。

第一个link元素提供了对这个tweet的一个链接。继续并将http://twitter.com/joelcomm/statuses/1369295498粘贴到浏览器窗口内,此时,应该会看到Joel正在“thinking...”。

第二个link元素提供了对Joel的相片的一个链接。

authorstanza提供了有关这个Twitter用户的信息。这里,您会看到Joel的全名以及Web站点URL。

对这个API进行了这么多的思考之后,您意识到这些信息非常棒并且您可以很容易地编写代码来解析Atom输出。当然,您也可以解析来自其他用户的时间表,而不仅仅限于JoelComm的。所解析的信息可被收集用作这个在线营销活动的相关数据。惟一的限制是您的想象:可能无极限

其他参数

除了id之外,user_timeline还具有其他几个参数。在上例中,还可以指定screen_name,而非id。若恰巧知道用户的数字TwitterID,还可以在user_id参数内指定它。

此外,使用since_id参数,可以指定ID大于在此参数内指定的数值的那些tweet(参见清单4)。之前,Joel著名的“thinking...”tweet的ID为1369295498。所以,如下的URL会返回晚于这个tweet的那些tweet。

清单4.检索JoelComm“thinking...”之后的时间表

http://twitter.com/statuses/user_timeline.xml?id=joelcomm&since_id=1369295498

参数max_id基本上是since_id的反转。它返回的是ID小于此参数值所指定的ID的那些tweet。

与ID相反,参数since允许您对时间表过滤器应用一个实际日期。page参数允许您对结果进行分页。默认的user_timeline调用会返回最近的20个tweet。若这些tweet的编号为1-20,那么清单5内的代码会返回tweet41-60。

清单5.检索JoelComm的第三组tweet(20个)

http://twitter.com/statuses/user_timeline.xml?id=joelcomm&page=3

其他函数

到目前为止,您已经充分领略了user_timeline函数。除此之外,TwitterAPI还提供了其他一些可通过REST访问的函数。

public_timeline函数(清单6)让您能够看到整个Twitterverse内的最新tweet—至少是为那些向公众提供其tweet的用户。

清单6.最新的tweet

http://twitter.com/statuses/public_timeline.xml

friends_timeline函数(清单7)让您能够看到您跟随的那些人的tweet。就如同您登录到Twitter并径直访问您的Twitter主页。

清单7.您跟随的那些人的最新tweet

http://twitter.com/statuses/friends_timeline.xml

若将清单7中的URL复制并粘贴到浏览器中,系统会提示您提供您的Twitter用户名和密码。您在Twitter内的主页是一个安全环境,因它包含了对直接消息的链接。所以,这是Twitter部分上的一个安全措施。(我将在本文稍后的部分详细讨论安全性。)

update函数允许使用RESTAPI进行实际的tweet。在本例中,这个函数调用必须通过POST请求(而非GET请求)完成。随POST请求提交的参数status包含这个实际tweet的文本。

replies函数会将这20个最新的@replies返回给通过身份验证的用户。基本上,@replies是被特别指定给特定用户的tweet。比如,如果您tweet@joelcommareyoudonethinkingyet?,那么该消息就会显示为一系列特别定向给JoelComm的消息之一。他通过单击其Twitter主页上的一个链接就可以看到这些消息。但是,@replies对跟随发出回复的用户的所有用户也是可见的。

对所有RESTAPI函数进行全面详细的解释超出了本文的范围。但是,在API文档内有对它们清晰的文档记录。

API使用上的限制

使用TwitterRESTAPI并非随意到可以做任何您想做的事。Twitter对其API的使用做了一定的限制以防止带宽杀手破坏特性集的有用性。

对于初学者而言,只允许最多每小时100个请求。虽然,这一限制只应用于GET(而非POST)请求,但经验证明它还是一个很不错的规则。如果超出了此限制,REST调用所产生的文档将会告诉您这一点。所以,不管出于何种原因而必须调用TwitterRESTAPI超过每小时100次时,可以从Twitter请求whitelisting。

另一个限制是不管使用page还是count参数,最多返回3200个状态。

此外,Twitter只请求但并不强制要求其他限制。比如,Twitter建议使用page属性,不建议使用count属性。又比如,它还建议对结果进行本地缓存,而不建议重复请求相同的状态

身份验证

正如我之前提到的,某些函数要求身份验证。如想使用TwitterRESTAPI并利用这些函数,就必须在请求中包含身份凭证。否则,就会获得状态码401的回复。

在本文写作之时,Twitter只支持HTTP基本的身份验证,这意味着此请求头必须以加密的格式包含您的用户名和密码。这之后,您就可以对此TwitterAPI函数进行全面的访问,就好像是从浏览器登录到Twitter一样。

目前,Twitter正致力于寻找一种方式来启用OAuth身份验证以获得安全请求。

结束语

Twitter是进入Web2.0世界的一个很好的切入点。使用Twitter,您可以借助微型blog,构建一个由与您志同道合的人组成的完整在线网络。

使用TwitterRESTAPI,您能够自动化以前用Twitter手动实现的所有功能。您可以以编程的方式访问一个特定用户的时间表。您可以直接或间接地回复给该用户。您可以针对您自己感兴趣的信息查找用户的tweet。您可以基于特定的标准过滤tweet并在您自己的blog上显示这些tweet。

存在无限可能性。

from:http://www.ibm.com/developerworks/cn/xml/x-twitterREST/

相关推荐