Hadoop 顺序数据访问

2024-04-08

根据 Hadoop 权威指南:

HDFS 是一个文件系统,设计用于存储非常大的文件 流式或顺序数据访问模式

什么是流式或顺序数据访问?它如何减少磁盘的寻道时间?


这并不是 Hadoop 特有的。

顺序访问模式是指按顺序读取数据(通常是从开始到结束)。考虑一本书的例子。阅读小说时,您使用顺序:从第 1 页开始,然后移至第 2 页,依此类推。另一种常见模式称为随机访问。这是当您从一个地方跳转到另一个地方,甚至在读取数据时可能会向后跳转。对于书籍示例,请考虑一本字典。你不像读小说那样读它。相反,您会在中间的某个位置搜索您的单词。当您查找完该单词后,您可能会去查找距离您当前打开的书的位置数百页之外的另一个单词。对应该从哪里开始阅读的搜索称为“搜索”。

当您按顺序访问时,您只需要查找一次,然后读取,直到完成该数据。进行随机访问时,每次想要切换到文件中的不同位置时都需要进行查找。这可能会对硬盘驱动器的性能造成相当大的影响,因为在磁驱动器上查找非常昂贵。

本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系:hwhale#tublm.com(使用前将#替换为@)

Hadoop 顺序数据访问 的相关文章

随机推荐