Apache Spark

Автор: Eugene Taylor
Дата На Създаване: 8 Август 2021
Дата На Актуализиране: 1 Юли 2024
Anonim
Что такое Apache Spark
Видео: Что такое Apache Spark

Съдържание

Определение - Какво означава Apache Spark?

Apache Spark е програма с отворен код, използвана за анализ на данни. Нейната част от по-голям набор от инструменти, включително Apache Hadoop и други ресурси с отворен код за днешната общност на аналитиката.


Експертите описват този сравнително нов софтуер с отворен код като инструмент за изчисляване на клъстери за анализ на данни. Може да се използва с разпределената файлова система (HDFS) на Hadoop, която е особен компонент на Hadoop, който улеснява сложната работа с файлове.

Някои ИТ специалисти описват използването на Apache Spark като потенциален заместител на компонента Apache Hadoop MapReduce. MapReduce е също инструмент за клъстериране, който помага на разработчиците да обработват големи набори от данни. Тези, които разбират дизайна на Apache Spark, посочват, че той може да бъде много пъти по-бърз от MapReduce, в някои ситуации.

Въведение в Microsoft Azure и Microsoft Cloud | В това ръководство ще научите какво представлява компютърните изчисления и как Microsoft Azure може да ви помогне да мигрирате и стартирате бизнеса си от облака.

Техопедия обяснява Apache Spark

Тези, които съобщават за съвременното използване на Apache Spark, показват, че компаниите го използват по различни начини. Една обща употреба е за обобщаване на данни и тяхното структуриране по по-прецизни начини. Apache Spark също може да бъде полезен при аналитична работа за машинно обучение или класификация на данните.


Обикновено организациите са изправени пред предизвикателството да усъвършенстват данните по ефикасен и донякъде автоматизиран начин, където Apache Spark може да се използва за тези видове задачи. Някои от тях предполагат също, че използването на Spark може да помогне за осигуряване на достъп до тези, които не познават по-малко програмирането и искат да се включат в работата с анализи.

Apache Spark включва API за Python и свързани езици на софтуера.