未来数据到底有多重要?IBM(微博)新任CEO罗睿兰(Ginni Rometty)的观点让人印象深刻 。她说,数据将是下一个大的自然资源,将会区分每个行业的胜者与输家。
大数据走红
关于什么是“大数据”,现在还没有标准的定义。维基百科上有人对大数据作了如下描述:数据增长如此之快,以至于难以使用现有的数据库管理工具来驾驭,困难存在于数据的获取,存储,搜索,共享,分析和可视化等方面。
“通俗地说,大数据其实是一种在互联网时代或信息时代的企业现象。”中国软件网、海比研究总经理曹开彬告诉新浪科技,在这样的时代,任何一个企业,尤其是大型企业和互联网企业,会在经营过程中产生大量的、各种各样的数据。它有几个典型特征:数据量大、数据类型复杂、处理速度要快。
所谓数据量大,是指数据不再以几个GB和几个TB为单位来衡量,而是以PB(1000个T)、EB(一百万个T)或ZB(10亿个T)为计量单位;数量类型复杂,是因为它的来源复杂,从结构化数据到非结构化数据;处理速度要快,则是指数据的分析和使用需要在极短的时间内完成,甚至实时使用。
曹开彬说,这导致现有的数据仓库和商业智能等数据处理和分析技术无法应对这种情况,但是企业要对它进行快速处理与分析的需求又很大,因此,大数据才会变得这样火。
资深IT人士谢文对于大数据有另外的看法。在他看来,大数据并不是新概念,而是在物理学,生物学等科学领域早已存在的理论,只不过此前没有有效的手段获取大数据。
他认为,Web2.0时代,大数据应该是以人为核心,以人的关系为基础作信息生产、交换,从而产生的巨大信息爆炸。同时,大数据将产生比现在更有价值的商业模式,是不能用现有技术进行处理的。
背后价值
那么,大数据到底能给企业带来什么价值呢?本质上说,大数据本身没有太多价值,基于大数据的处理和分析才能为企业带来的巨大的增值价值。
曹开彬认为,大数据里面包含企业运营的各种信息,如果能对它们进行及时有效充分地整理和分析,才可以很好地、迅速地帮助企业进行业务决策,响应客户需求,提升竞争力。
两个月前,刚刚以大数据概念在纳斯达克(微博)上市的美国公司Splunk可以让我们很容易的理解这一点。
Splunk提供一款可运行于各种平台的IT数据、日志分析软件,可以让IT运维人员以类似谷歌搜索关键词的方式,快速搜索并查看任何IT设备运行过程中产生的信息。
一个简单的场景是,当IT设备出现异常时,IT运维人员只需要搜索关键词“Error”,系统便会列出包含“Error”的机器运行日志,并以非常好的图形化方式展现出来。IT运维人员可以据此判断出是异常出现的具体时间,具体设备,并分析故障原因。
显然,与以前凭借经验进行故障判断相比,数据分析提供了更精准的信息,而这便是大数据的魅力所在。那么,企业该如何抓住大数据带来的机遇呢?
Teradata大中华区首席执行官辛儿伦对新浪科技表示,随着大数据时代的到来,企业应该在内部培养三种能力。第一,整合企业数据的能力;第二,探索数据背后价值和制定精确行动纲领的能力;第三,进行精确快速实时行动的能力。
“如果企业在信息治理上培养出这三种能力,对未来大数据时代的驾驭能力会增强,对面临到的挑战会降到最低。”辛儿伦表示。
厂商布局
辛儿伦所在的Teradata公司是一家智能分析解决方案厂商,主要为企业和政府机构做数据整合,分析,探索、挖掘数据背后的价值。最近两年,Teradata通过收购将业务从结构化数据延伸到非结构化、大数据领域。
2011年,Teradata先后收购了云计算软件公司Aprimo及高级分析和管理各种非结构化数据领域的Aster Data公司。今年5月8日,Aprimo收购了基于云的数字营销欧洲领导厂商eCircle,进一步加强并拓展了Teradata大数据市场的业务。
与Teradata一样看好的大数据的还有IBM、甲骨文、惠普(微博)、EMC、微软等传统IT厂商,他们也在通过自主研发或者收购的方式进入大数据领域。
IBM在过去五年里,已经斥资超过140亿美元进行了20多笔与数据分析相关的收购交易。甲骨文这家以结构化数据库起家的IT公司,推出了大数据机及智能分析解决方案。
去年8月,惠普以100亿美元收购英国软件公司Autonomy,其实也是为了扩大商业分析软件的市场份额。Autonomy通过独有的算法可以提取出非结构化信息中的含义。
在美国硅谷,Splunk只是大数据领域的一家企业而已,仍有多家创业公司已经聚焦在大数据领域,并且获得风险投资的注资。
评论
查看更多