Профилиране на данни

Автор: Lewis Jackson
Дата На Създаване: 10 Може 2021
Дата На Актуализиране: 25 Юни 2024
Anonim
Оркестриране обработката на големи данни с Apache Airflow - Кирил Митов
Видео: Оркестриране обработката на големи данни с Apache Airflow - Кирил Митов

Съдържание

Определение - Какво означава Профилиране на данни?

Профилирането на данни е техника, използвана за изследване на данни за различни цели като определяне на точността и пълнотата. Този процес изследва източник на данни като база данни, за да разкрие грешните области в организацията на данните. Разгръщането на тази техника подобрява качеството на данните.


Профилирането на данни се нарича също откриване на данни.

Въведение в Microsoft Azure и Microsoft Cloud | В това ръководство ще научите какво представлява компютърните изчисления и как Microsoft Azure може да ви помогне да мигрирате и стартирате бизнеса си от облака.

Techopedia обяснява профилирането на данни

Профилирането на данни е методът за изследване на наличните данни в източник на данни и събиране на статистически данни и информация за тези данни. Такава статистика помага да се идентифицира използването и качеството на данните на метаданните. Този метод се използва широко при съхранение на данни на предприятието.

Профилирането на данни изяснява структурата, връзката, съдържанието и правилата за извличане на данни, които подпомагат разбирането на аномалиите в метаданните. Профилирането на данни използва различни видове описателна статистика, включително средно, минимално, максимално, процентилно, честотно и други агрегати, като брой и сбор. Допълнителната информация за метаданните, получена по време на профилирането, е тип данни, дължина, дискретни стойности, уникалност и абстрактно разпознаване на типа.