![Оркестриране обработката на големи данни с Apache Airflow - Кирил Митов](https://i.ytimg.com/vi/bvDTnS-uCPI/hqdefault.jpg)
Съдържание
- Определение - Какво означава Профилиране на данни?
- Въведение в Microsoft Azure и Microsoft Cloud | В това ръководство ще научите какво представлява компютърните изчисления и как Microsoft Azure може да ви помогне да мигрирате и стартирате бизнеса си от облака.
- Techopedia обяснява профилирането на данни
Определение - Какво означава Профилиране на данни?
Профилирането на данни е техника, използвана за изследване на данни за различни цели като определяне на точността и пълнотата. Този процес изследва източник на данни като база данни, за да разкрие грешните области в организацията на данните. Разгръщането на тази техника подобрява качеството на данните.
Профилирането на данни се нарича също откриване на данни.
Въведение в Microsoft Azure и Microsoft Cloud | В това ръководство ще научите какво представлява компютърните изчисления и как Microsoft Azure може да ви помогне да мигрирате и стартирате бизнеса си от облака.
Techopedia обяснява профилирането на данни
Профилирането на данни е методът за изследване на наличните данни в източник на данни и събиране на статистически данни и информация за тези данни. Такава статистика помага да се идентифицира използването и качеството на данните на метаданните. Този метод се използва широко при съхранение на данни на предприятието.
Профилирането на данни изяснява структурата, връзката, съдържанието и правилата за извличане на данни, които подпомагат разбирането на аномалиите в метаданните. Профилирането на данни използва различни видове описателна статистика, включително средно, минимално, максимално, процентилно, честотно и други агрегати, като брой и сбор. Допълнителната информация за метаданните, получена по време на профилирането, е тип данни, дължина, дискретни стойности, уникалност и абстрактно разпознаване на типа.