Others and Big Data

Clustering

  • allow multiple servers to act as a single database.

Sharding

  • 类似于table partition但是将大的database partitioning成较小的database.

Big Data

  • 3 Vs
    • Volume
      • 数据量极大
    • Velocity
      • 数据获取速度快
    • Variety
      • 数据种类较多,既有结构化的数据(如关系型数据库),也有非结构化的数据(如视频,音频)
Hadoop
  • 一种分布式的应用程序
  • 组成
    • Hadoop Distributed File System (HDFS)
      • 使得跨多个服务器的文件管理得以实现
    • MapReduce
      • 可以通过将大文件分为多个小文件在多个服务器并行存储的方式,加快文件的存储速度。
    • YARN
      • 源管理
NoSQL and Document Databases
  • 将未知结构的数据变为document 数据,如JSON和XML,然后放入SQL 服务器中存储

results matching ""

    No results matching ""