Съдържание
- Определение - Какво означава анализ на големи данни с отворен код?
- Въведение в Microsoft Azure и Microsoft Cloud | В това ръководство ще научите какво представлява компютърните изчисления и как Microsoft Azure може да ви помогне да мигрирате и стартирате бизнеса си от облака.
- Techopedia обяснява анализи за големи данни с отворен код
Определение - Какво означава анализ на големи данни с отворен код?
Анализът на големи данни с отворен код се отнася до използването на софтуер и инструменти с отворен код за анализиране на огромни количества данни, за да се събере подходяща и приложима информация, която една организация може да използва за постигане на своите бизнес цели. Най-големият играч в анализа на големи данни с отворен код е Apaches Hadoop - това е най-широко използваната софтуерна библиотека за обработка на огромни набори от данни в клъстер от компютри, използващи разпределен процес за паралелизъм.
Въведение в Microsoft Azure и Microsoft Cloud | В това ръководство ще научите какво представлява компютърните изчисления и как Microsoft Azure може да ви помогне да мигрирате и стартирате бизнеса си от облака.
Techopedia обяснява анализи за големи данни с отворен код
Анализът на големи данни с отворен код използва софтуер и инструменти с отворен код за изпълнение на анализи на големи данни чрез използване на цяла софтуерна платформа или различни инструменти с отворен код за различни задачи в процеса на анализиране на данни. Apache Hadoop е най-известната система за анализиране на големи данни, но са необходими други компоненти, преди да може да се събере реална аналитична система.
Hadoop е реализацията с отворен код на алгоритъма MapReduce, създаден от Google и Yahoo, така че той е основата на повечето аналитични системи днес. Много инструменти за анализиране на големи данни използват отворен код, включително стабилни системи от бази данни като отворен код MongoDB, сложна и мащабируема база данни NoSQL, много подходяща за приложения с големи данни, както и други.
Услугите за анализиране на големи данни с отворен код включват:
- Система за събиране на данни
- Център за контрол за администриране и наблюдение на клъстери
- Библиотека за машинно обучение и извличане на данни
- Услуга за координация на приложения
- Изчислете двигателя
- Рамка за изпълнение