Hadoop разпределена файлова система (HDFS)

Автор: Judy Howell
Дата На Създаване: 28 Юли 2021
Дата На Актуализиране: 1 Юли 2024
Anonim
Hadoop. Распределённая файловая система HDFS
Видео: Hadoop. Распределённая файловая система HDFS

Съдържание

Определение - Какво означава разпределената файлова система (HDFS) на Hadoop?

Разпределената файлова система Hadoop (HDFS) е разпределена файлова система, която работи на стандартен или нисък клас хардуер. Разработен от Apache Hadoop, HDFS работи като стандартна разпределена файлова система, но осигурява по-добра пропускане на данни и достъп чрез алгоритъма MapReduce, висока толерантност и естествена поддръжка на големи масиви данни.


Въведение в Microsoft Azure и Microsoft Cloud | В това ръководство ще научите за какво се занимава компютърните изчисления и как Microsoft Azure може да ви помогне да мигрирате и стартирате бизнеса си от облака.

Techopedia обяснява разпределената файлова система Hadoop (HDFS)

HDFS съхранява голямо количество данни, разположени на множество машини, обикновено в стотици и хиляди едновременно свързани възли и осигурява надеждност на данните, като репликира всеки екземпляр от данни като три различни копия - две в една група и едно в друга. Тези копия могат да бъдат заменени в случай на повреда.

HDFS архитектурата се състои от клъстери, до всеки от които се осъществява достъп чрез един софтуерен инструмент NameNode, инсталиран на отделна машина за наблюдение и управление на файловата система на този клъстер и механизма за достъп на потребителите. Останалите машини инсталират един екземпляр на DataNode, за да управляват съхранението на клъстери.


Тъй като HDFS е написан на Java, той има вградена поддръжка за интерфейси за програмиране на Java приложения (API) за интеграция и достъпност на приложенията. Достъпът до него също може да става чрез стандартни уеб браузъри.