微软展开“大数据”蓝图,推进Hadoop至Azure和Windows Server

Harper 2012-07-31

微软已经展开了他们的“大数据”蓝图,其中担当主要角色的就是Apache Hadoop。

Hadoop是一个分布式系统基础架构,由Apache基金会开发。它是一个能够对大量数据进行分布式处理的软件框架。用户可以在不了解分布式底层细节的情况下,开发分布式程序,充分利用集群的威力高速运算和存储。

在12日西雅图召开的微软PASS(ProfessionalAssociationforSQLServer,SQLServer专家协会)Summit会议上,微软公司副总裁TedKumert描绘了这一蓝图。TedKumert表示,该蓝图“旨在帮助用户管理及分析任何大小、任何位置(包括固定地址或在私有及公共云上)的所有数据”。

TedKunment同时透露,下一版本的SQLServer(代号Denali)已正式命名为SQLServer2012。在Kunment提供路线图中的一项计划就是,将SQLServer2012并入Hadoop分布式计算平台,以及将Hadoop引入WindowsServer和Azure(微软的云服务)。

也就是说,运行SQLServer的微软客户将通过Hadoop的引入获得真正的大数据处理能力。微软此前发布了早期代码,让客户可以将这个Java架构接入到SQLServer2008R2、SQLServerParallelDataWarehouse以及新的SQLServer2012数据库。SQLServer2012将在明年上半年推出。

微软的开放源代码社交资深总监Gianugo在博客中写道:
基于Hadoop的Windows Azure服务可以让开发人员和用户直接在Azure云上提交及运行Hadoop作业,从而带来简单的用户体验。

我们一直致力提供一个简单的下载、安装及配置Hadoop相关技术的体验,包括HDFS、Hive以及Pig,以帮助企业接受Hadoop。

对于开发人员,我们则将在微软开发者工具中集成该技术,同时我们将为大数据投资JavaScript,打造它的第一流语言位置。最终将实现使用JavaScript来编写高性能的Map/Reduce作业。没错,Javascript Map/Reduce。

今天八月的DataWarehousingInstitute会议上,微软曾推出了一个基于Sqoop(SQL-to-Hadoop,一个在Hadoop和关系型数据库间进行数据导入导出工具)的SQLServerHadoop连接器的预览版本。目前该连接器也正式发布了。

相关推荐