摘要:分布式文件系统(DFS)能够高效管理数据中心的存储资源, 已经成为支撑众多数据密集型应用的核心基础设施. 为了降低执行文件系统操作时路径解析的开销, 分布式文件系统普遍采用了客户端元数据缓存, 同时在客户端之间同步元数据修改以保证元数据缓存的一致性. 但是现有的元数据缓存一致性方案在引入了高昂性能开销的情况下, 仍然未能正确同步全部的目录树修改, 导致正确性问题. 针对这一现状, 本文提出了一种维护元数据缓存一致性的轻量级机制, 通过基于并发广播机制的目录树修改方法以及基于惰性广播和墓碑机制的目录删除方法, 既突破了现有方案的性能瓶颈又解决了正确性缺陷. 实验结果表明, 这种机制使得分布式文件系统中目录树修改操作的延迟降低了65.8%–66.9%, 吞吐量提升了2.94–4.53倍. 此外, 在运行Spark作业时, 作业提交的延迟下降了43.6%.