|
知识路径: > 网络与信息安全知识 > 网络与信息安全知识 > 云计算 > 云计算基础知识 > 云关键技术 > 分布式数据存储 >
|
考试要求:掌握
相关知识点:3个
|
|
|
|
为了存储和管理云计算中的海量数据,Google提出分布式文件系统GFS(Google File System),Apache Hadoop项目的HDFS实现了GFS的开源版本。
|
|
|
Google GFS是一个大规模分布式文件存储系统,其设计的特点如下:
|
|
|
.利用多副本自动复制技术,用软件的可靠性来弥补硬件可靠性的不足。
|
|
|
.将元数据和用户数据分开,用单点或少量的元数据服务器进行元数据管理,大量的用户数据结点存储分块的用户数据,规模可以达到PB级。
|
|
|
.面向一次写多次读的数据处理应用,将存储与计算结合在一起,利用分布式文件系统中数据的位置相关性进行高效的并行计算。
|
|
|
GFS/HDFS非常适于进行以大文件形式存储的海量数据的并行处理。
|
|
|