Данни или машинно обучение? Ето как да забележим разликата

Видео: Лимфодренажный массаж кинезиология. Не антицеллюлитный.

Съдържание

Наука за данни и машинно обучение: широка и тясна терминология
Комплекти умения за наука за данни и машинно обучение
Без грешки, без стрес - Вашето стъпка по стъпка ръководство за създаване на софтуер, променящ живота, без да разрушава живота ви
Как да забележим машинно обучение
Две дисциплини за рязане

Източник: Elnur / Dreamstime.com

За вкъщи:

Науката за данни и машинното обучение са различни по ключови начини. По някакъв начин човек може да се разглежда като подмножество на другия. И двете са важни за настоящия напредък в ИТ.

В този нов свят на изкуствен интелект и управление на данни е лесно да се объркате от някои от термините, които се използват най-често в ИТ света.

Например, науката за данни и машинното обучение имат много общо помежду си. Не е изненадващо, че много хора, които само познават тези дисциплини, ще имат проблеми да разберат как се различават една от друга.

Ето най-добрият начин да отделите науката за данни от машинното обучение, като принцип и като технологичен подход.

Наука за данни и машинно обучение: широка и тясна терминология

На първо място, науката за данни е наистина широка, всеобхватна категория технологии, която обхваща много различни видове проекти и творения. (За повече информация относно това, което участва в работата по наука с данни, вижте Job Role: Data Scientist.)

Науката за данни по същество е практиката на работа с големи данни. Той се появи като закон на Мур и разпространението на по-ефективни устройства за съхранение доведе до събиране на огромни количества данни от компании и други страни. След това големи платформи за данни и инструменти като Hadoop започнаха да предефинират изчисленията, променяйки начина на работа на управлението на данните. Сега, с облак и контейнеризация, както и чисто нови модели, големите данни се превърнаха в основен двигател на начините, по които работим и живеем.

В най-простата си форма науката за данни е начинът, по който управляваме тези данни, от тяхното почистване и усъвършенстване до използването им под формата на прозрения.

Определението за машинно обучение е много по-тясно. При машинното обучение технологиите приемат данни и ги поставят чрез алгоритми, за да се симулират познавателните процеси на човека, описани като „учене“. С други думи, като вземе данните и се обучи на тях, компютърът е в състояние да предостави собствени резултати , където технологията изглежда се е научила от процесите, които програмистите въвеждат.

Комплекти умения за наука за данни и машинно обучение

Друг начин за противопоставяне на науката за данни и машинното обучение е да се разгледат различните умения, които са най-ценни за професионалистите в която и да е от тези области.

Без грешки, без стрес - Вашето стъпка по стъпка ръководство за създаване на софтуер, променящ живота, без да разрушава живота ви

Не можете да подобрите уменията си за програмиране, когато никой не се интересува от качеството на софтуера.

Има общ консенсус, че учените за данни се възползват от дълбоки аналитични и математически умения, практически опит с технологии на базата данни и познаване на езици за програмиране като Python или други пакети, които се използват за анализ на големи данни.

„Всеки, който се интересува от изграждането на силна кариера в областта на (науката за данните), трябва да придобие ключови умения в три отдела: аналитика, програмиране и познания в областта на домейните“, пише Шрихари Сасикумар от Simplilearn. „Постигането на едно ниво по-дълбоко, следните умения ще ви помогнат да издигнете ниша като учен с данни: Силни познания за Python, SAS, R (и) Scala, практически опит в кодирането на SQL база данни, способност за работа с неструктурирани данни от различни източници като видео и социални медии, разбират множество аналитични функции (и) знания за машинно обучение. "

От страна на машинното обучение, експертите често цитират умения за моделиране на данни, знания за вероятност и статистика и по-широки умения за програмиране като полезни инструменти в инструментариума на машинното обучение на инженера.

Как да забележим машинно обучение

Ключовото тук е, че всякакви неща включват работа с наука за данни, но това не е машинно обучение, освен ако не сте създали много строг режим, който да помогне на компютъра да се учи от неговите данни.

Когато това е налице, това прави някои изненадващо способни системи, които могат да имат широк ефект върху живота ни.

„Голяма част от това, което правим с машинното обучение, се случва под повърхността“, според съобщенията основателят на Amazon Джеф Безос, посочвайки някои от приложенията на тези видове системи. „Машинното обучение задвижва нашите алгоритми за прогнозиране на търсенето, класиране на търсенето на продукти, препоръки за продукти и сделки, разположения на мърчандайзинг, откриване на измами, преводи и много други. Макар и по-малко видими, голяма част от въздействието на машинното обучение ще бъде от този тип - тихо, но значимо подобряване на основните операции. "

Един от най-полезните примери тук е появата на невронната мрежа - това е често срещан и популярен метод за настройка на процесите на машинно обучение.

В най-основната си форма невронната мрежа е съставена от слоеве от изкуствени неврони. Всеки отделен изкуствен неврон има функционалност, еквивалентна на биологичен неврон - но вместо синапси и дендрити, той има входове, функция за активиране и евентуални изходи.

Невронната мрежа е направена да действа като човешки мозък и специалистите по машинно обучение често използват този модел за създаване на резултати от машинно обучение.

Това обаче не е единственият начин за машинно обучение. Някои по-рудиментарни проекти за машинно обучение просто включват показване на компютър широка гама от снимки (или предоставяне на него с други необработени данни), въвеждане на идеи чрез процеса на използване на контролирано машинно обучение и данни на етикетите и на компютъра в крайна сметка да може да прави разлика между различни форми или елементи във визуално поле. (За основите на машинното обучение, вижте Машинното обучение 101.)

Две дисциплини за рязане

В заключение, машинното обучение е ценна част от науката за данни. Но науката за данните представлява границата на вастера и конфетата, в която се осъществява машинното обучение.

По някакъв начин можете да кажете, че машинното обучение никога няма да се случи без големи данни. Самите големи данни обаче не създават машинно обучение - вместо това, след като събрахме колективно толкова много данни, че почти не знаехме какво да правим с тях, висшите умове излязоха с тези биосимулиращи процеси като заредени за предоставяне на прозрения.

Друго хубаво нещо, което трябва да се има предвид тук, е, че науката за данни може да бъде приложена по два основни начина - можем да възприемем машинно обучение и изкуствен интелект, оставяйки компютрите да мислят за нас или можем да върнем науката за данни към един по-ориентиран към човека подход, където компютърът просто представя резултати и ние като хора вземаме решенията.

Това води водещите експерти, включително някои от най-добрите съвременни иноватори, да призовават за по-динамично отчитане на начините, по които използваме тези технологии.

"(AI) е способен на много повече, отколкото почти всеки знае, а темпът на подобрение е експоненциален", цитира Елон Мъск, като предупреждава, че машинното обучение и AI програмите изискват надзор.

Във всеки случай, както науката за данни, така и машинното обучение са основни части от напредъка, който ние като общества постигаме в технологиите днес.