Others and Big Data
Clustering
- allow multiple servers to act as a single database.
Sharding
- 类似于table partition但是将大的database partitioning成较小的database.
Big Data
- 3 Vs
- Volume
- 数据量极大
- Velocity
- 数据获取速度快
- Variety
- 数据种类较多,既有结构化的数据(如关系型数据库),也有非结构化的数据(如视频,音频)
- Volume
Hadoop
- 一种分布式的应用程序
- 组成
- Hadoop Distributed File System (HDFS)
- 使得跨多个服务器的文件管理得以实现
- MapReduce
- 可以通过将大文件分为多个小文件在多个服务器并行存储的方式,加快文件的存储速度。
- YARN
- 源管理
- Hadoop Distributed File System (HDFS)
NoSQL and Document Databases
- 将未知结构的数据变为document 数据,如JSON和XML,然后放入SQL 服务器中存储