hanfeng.name

I am a software engineer with interests in web applications.

大数据简介

网易云课堂-大数据简介

大数据的定义

大数据可以定义为一个巨大的数据集, 在可接受的时间范围内,它可以用来获取、存储、搜索、转换、分析以及可视化相关的信息或数据。

大数据的三个特性

  1. Volume 容量巨大
  2. Velocity 产生速度快 处理速度快
  3. Variety 种类繁多

例子:

  • Twitter每秒产生80M的数量
  • eBay每天可以实施分析500万交易
  • 产生的数据又各种类型,因为数据的来源不同。数据有结构化数据(database,excel)、半结构化数据(word)和非结构化数据(图片、文件)。

大数据的三个来源

  1. 社交
  2. 机器 : 例如RFID射频识别信息
  3. 交易数据

Comments