大数据(Big Data)是用于数据集的一个术语,是指大小超出了常用的软件工具 在运行时间内可以承受的收集,管理和处理数据能力的数据集。换句话说,在单一数据集里,数据规模超出目前常用软件工具在合理的可容忍时间里可以访问、管 理、处理能力的数据集就是大数据。由于软件的能力是与时俱进的,因而大数据规模的定量界限就是随着技术 进步而不断增大。大数据的规模大小是一个不断演化的 指标,目前范围是指在一个单一的数据集从数TB 到十几 PB 级的数据规模。
大数据的特征可以用所谓的3个“V”表示:体量(Volume)、多样性(Variety)与速度(Velocity)。体 量(Volume)是指聚合在一起供分析的数据量必须是 非常庞大的。无所不在的移动设备、RFID、无线传感 器每分每秒都在产生数据,数以亿计用户的互联网服务 时时刻刻在产生巨量的交互。
云计算(Cloud Computing),是一种基于互联网的计算方式,通过这种方式,共享的软硬件资源和信息可以按需提供给计算机和其他设备。典型的云计算提供商往往提供通用的网络业务应用,可以通过浏览器等软件或者其他Web服务来访问,而软件和数据都存储在服务器上。云计算服务通常提供通用的通过浏览器访问的在线商业应用,软件和数据可存储在数据中心。
总的来说,未来的趋势是,云计算作为计算资源的底层,支撑着上层的大数据处理,而大数据的发展趋势是,实时交互式的查询效率和分析能力。云计算就是硬件资源的虚拟化;大数据就是海量数据的高效处理。如果能更好的将云计算与大数据进行整合,那么对于数据的分析起着很大的促进作用。
上一篇:大数据与乔布斯的癌症治疗
下一篇:大数据何以如此重要