Анализ на големи данни с отворен код

Автор: Laura McKinney
Дата На Създаване: 1 Април 2021
Дата На Актуализиране: 14 Може 2024
Anonim
Полное руководство по Google Forms - универсальный инструмент для опросов и сбора данных онлайн!
Видео: Полное руководство по Google Forms - универсальный инструмент для опросов и сбора данных онлайн!

Съдържание

Определение - Какво означава анализ на големи данни с отворен код?

Анализът на големи данни с отворен код се отнася до използването на софтуер и инструменти с отворен код за анализиране на огромни количества данни, за да се събере подходяща и приложима информация, която една организация може да използва за постигане на своите бизнес цели. Най-големият играч в анализа на големи данни с отворен код е Apaches Hadoop - това е най-широко използваната софтуерна библиотека за обработка на огромни набори от данни в клъстер от компютри, използващи разпределен процес за паралелизъм.


Въведение в Microsoft Azure и Microsoft Cloud | В това ръководство ще научите какво представлява компютърните изчисления и как Microsoft Azure може да ви помогне да мигрирате и стартирате бизнеса си от облака.

Techopedia обяснява анализи за големи данни с отворен код

Анализът на големи данни с отворен код използва софтуер и инструменти с отворен код за изпълнение на анализи на големи данни чрез използване на цяла софтуерна платформа или различни инструменти с отворен код за различни задачи в процеса на анализиране на данни. Apache Hadoop е най-известната система за анализиране на големи данни, но са необходими други компоненти, преди да може да се събере реална аналитична система.

Hadoop е реализацията с отворен код на алгоритъма MapReduce, създаден от Google и Yahoo, така че той е основата на повечето аналитични системи днес. Много инструменти за анализиране на големи данни използват отворен код, включително стабилни системи от бази данни като отворен код MongoDB, сложна и мащабируема база данни NoSQL, много подходяща за приложения с големи данни, както и други.


Услугите за анализиране на големи данни с отворен код включват:

  • Система за събиране на данни
  • Център за контрол за администриране и наблюдение на клъстери
  • Библиотека за машинно обучение и извличане на данни
  • Услуга за координация на приложения
  • Изчислете двигателя
  • Рамка за изпълнение