【专治不明觉厉】之“大数据”
【文章来源:虎嗅网】
虎嗅注:上一篇“专治不明觉厉”文章,虎嗅君为大家介绍了“云计算”领域中的那些“不明觉厉”的名词。作为云计算最重要的应用,大数据领域也有很多看上去“不明觉厉”的词汇。本篇文章,虎嗅君就为各位介绍“大数据”领域里的“不明觉厉”。
大数据(Big Data)
大数据,官方定义是指那些数据量特别大、数据类别特别复杂的数据集,这种数据集无法用传统的数据库进行存储,管理和处理。大数据的主要特点为数据量大(Volume),数据类别复杂(Variety),数据处理速度快(Velocity)和数据真实性高(Veracity),合起来被称为4V。
大数据中的数据量非常巨大,达到了PB级别。而且这庞大的数据之中,不仅仅包括结构化数据(如数字、符号等数据),还包括非结构化数据(如文本、图像、声音、视频等数据)