Google File System 论文阅读

GFS是Google在2003年发表的一篇论文，虽然Morris在6.824上说这篇论文并没有太多的创新点，但是它成功构建了一个由1000多台廉价机器组成的分布式存储集群，在当时算是技惊四座的存在，于是就被计算机系统领域最顶级的会议接收了。

摘要

GFS文件系统是一个面向大规模数据密集型应用、可伸缩(scalable)的分布式文件系统。GFS虽然运行在廉价的普通硬件上，但是它提供了容错机制(fault tolerance)，并且为大量的客户机提供了高性能的服务。

GFS的设计目标与传统的分布式文件系统类似，但是根据谷歌内部的应用负载情况和技术环境作出了一些改变。我们重新审视了传统文件系统在设计上的折衷选择，衍生出了完全不同的设计思路。

GFS满足了谷歌对于存储的需求，并且已经广泛部署在了谷歌内部，存储大量数据的同时还作为大规模数据集的研究和开发工作。在2003年，谷歌最大的集群用几千个硬盘提供了几百T的空间，可以为好几百个客户机服务。

谷歌不同于传统分布式存储系统的设计思路如下：

将组件崩溃(component failures)视为常态而不是意外，由于GFS运行在成百上千台廉价的存储机器上，所以任何意外都有可能存在，比如应用程序bug，操作系统bug，人为错误，机器故障等等，因此必须将持续的监控、错误侦测、灾难冗余以及自动恢复集成到GFS中。
文件大，好几G的文件非常普遍，用管理小文件的方式来管理这些文件肯定不太合适，因此需要重新设计IO操作和Block的尺寸。
绝大部分的文件修改是在文件尾部添加数据，而不是覆盖操作。随机写入的操作也基本不存在。一旦文件写入以后，以后基本不会修改，只有读取，而且是按顺序读。对于这些访问模式，客户端对于数据块的缓存没有必要，因此，需要重点考虑的就是数据的追加操作，它是性能优化和原子保证的主要考量因素。
应用程序和文件系统API的协同设计提高系统的灵活性。GFS放松了对于一致性模型的要求，采用弱一致性的方式，简化了对于GFS的设计。引入原子性的记录追加操作，来保证多客户端之间数据追加的一致性，而不需要额外的同步操作