12 ключови съвета за научаване на данни

Автор: Laura McKinney
Дата На Създаване: 3 Април 2021
Дата На Актуализиране: 1 Юли 2024
Anonim
Нежный ночной дождь 12 ЧАСОВ - Сон, бессонница, медитация, расслабление, учеба
Видео: Нежный ночной дождь 12 ЧАСОВ - Сон, бессонница, медитация, расслабление, учеба

Съдържание


Източник: Artinspiring / Dreamstime.com

За вкъщи:

Учените за данни очевидно се нуждаят от силни умения по математика и кодиране, но комуникацията и другите меки умения също са от съществено значение за успеха.

Data Scientist се нарежда като най-добрата работа за 2019 г. в Америка на Glassdoor. С средна базова заплата от 108 000 щатски долара и степен на удовлетвореност от 4,3 от 5 плюс плюс предвиден брой отвори, това не е изненадващо. Въпросът е: Какво трябва да направите, за да се включите, за да се квалифицирате за тази работа?

За да разберем, потърсихме съветите, дадени на тези, които се стремят да се качат на тази кариера. Много се свежда до твърдите умения в кодирането и математиката. Но само това силно изчисление не го решава. Учените за успешни данни също трябва да могат да говорят с бизнесмените сами, което изисква възможности, свързани с меки умения и лидерство. (За да научите повече за задълженията на учен с данни, вижте Job Role: Data Scientist.)


Изграждане на образователната фондация: Три основни съвета

Дрейс Джан, учен по данни от Академията за научни данни в Ню Йорк, подчертава необходимостта от образователна основа, която да включва основите на кодирането и математическата способност:

  1. R / Python + SQL. Ако нямате умения за кодиране, се нуждаете от много мрежова мощност и други области, за да увеличите този дефицит. Виждал съм учени с данни със слаб опит в математиката и малко домейн, но винаги са били носени от силна способност да кодират. Python е идеален, но R е чудесен инструмент за връщане назад. Най-добре е да имате и двамата в арсенала си. SQL също е изключително важен за анализатора на данни.

  2. Силни математически умения. Да имаш много добро разбиране на някои от често използваните методи: генерализирани линейни модели, дърво на решения, K-средства и статистически тестове е по-добре, отколкото да имаш широка картина на различни модели или специализация като RNN.

Това са основни умения за надграждане, въпреки че някои експерти ги добавят. Например списъкът на KDnuggets включва кодиращите компоненти, които Джан спомена и добавя някои други полезни неща, които трябва да знаете от техническата страна, включително платформата Hadoop Apache Spark, визуализация на данни, неструктурирани данни, машинно обучение и AI.


Но ако вземем сигнала си от анкета за най-често използваните инструменти, идентифицирани за използване в реалния живот чрез изследване на Kaggle, получаваме малко по-различни резултати. Както можете да видите от графиката на първите 15 възможности за избор по-долу, Python, R и SQL лесно правят първите три, но четвъртият е тефтер на Юпитер, следван от TensorFlow, Amazon Web Services, Unix shell, Tableau, C / C ++, NoSQL , MATLAB / Octave и Java, всички пред Hadoop и Spark. Още едно допълнение, което може да изненада хората, е Microsoft Excel Data Mining.

С любезното изображение на Kaggle

Списъкът с KDnuggets също включва съвет относно официалното образование. Повечето учени разполагат с напреднали степени: 46 процента имат докторантура, а 88 процента притежават поне магистърска степен. Бакалавърските степени, които притежават, обикновено са разделени между свързани области. Около една трета са по математика и статистика, което е най-популярното за тази кариера. Следващата най-популярна е степен по компютърни науки, държана с 19 процента, и инженерство, изборът от 16 процента. Разбира се, техническите средства, специфични за науката за данни, често не се изучават в програмите за степен, а в специализирани лагери за зареждане или чрез онлайн курсове.

Повече от курсове: Още два съвета

Ханк Юн, научен сътрудник в белодробния отдел в Weill Cornell Medicine и студент в NYC Data Science Academy, съветва амбициозните учени за данни да планират какво ще работят и да намерят наставник. Той каза:

Без грешки, без стрес - Вашето стъпка по стъпка ръководство за създаване на софтуер, променящ живота, без да разрушава живота ви

Не можете да подобрите уменията си за програмиране, когато никой не се интересува от качеството на софтуера.

Не правете грешката, която направих, като си казахте, че знаете науката за данни, защото сте преминали курс и сте получили сертификат. Това е чудесно начало, но когато започнете да учите, преминете с проект на ум. След това намерете ментор в областта и започнете страстен проект веднага! Когато сте свеж, не знаете какво не знаете, така че помага, когато някой е там, за да ви насочи към това, което е важно за вас и кое не. Не искате да отделяте много време за учене, без да показвате нищо за това!

Знаейки кой инструмент да извадите от кутията си с инструменти: Съвет, за да останете пред кривата

Като се има предвид различието в класирането на инструментите за наука за данни, някои може да се чувстват объркани върху това, върху което да се съсредоточат. Селест Фралик, главен учен по данни в компанията за софтуер за сигурност McAfee, се занимава с проблема в CIO статия, която разглежда основните умения за учен с данни, заявявайки: „Учен човек с данни трябва да стои пред кривата в научните изследвания, както и разберете каква технология да приложите. “Това означава да не бъдете примамвани от„ секси “и нови, когато действителният проблем“ изисква нещо много по-голямо движение. „Осъзнаването на изчислителните разходи за екосистемата, интерпретируемостта, латентността, широчината на честотната лента и други гранични условия на системата - както и зрелостта на клиента - само по себе си помага на учения по данни да разбере каква технология да приложи.“

Основни меки умения: още шест съвета

Въпросът, който Фралик разкрива, се отнася до нетехническите умения, които изискват работата на учения по данни. Ето защо списъкът на KDnuggets включва тези четири: интелектуално любопитство, работа в екип, комуникационни умения и бизнес умение. Джан също включи ключови меки умения в съветите си за учени по данни, идентифицирайки „комуникационни умения“ като KDnuggets, но използвайки „експертиза в областта на домейните“ вместо „бизнес хем. бизнес. (За да научите повече за комуникационните умения, вижте Значението на комуникационните умения за техническите специалисти.)

Оливия Пар-Руд предложи своя собствен опит за това, като добави още две меки умения, с акцент върху ролята на креативността, отстоявайки: „Мисля, че науката за данни е изкуство толкова, колкото науката“, нещо, което изисква да се насочи към силните страни на двете страни на мозъка. „Много хора говорят за науката за данни като за кариера, която използва предимно левия мозък. Открих, че за да бъдат успешни, учените с данни трябва да използват целия си мозък. "

Тя обясни, че за напредването в областта са необходими не просто техническа компетентност, а креативност и визия, необходима за лидерството:

Повечето задачи с ляв мозък / линейни могат да бъдат автоматизирани или да бъдат извличани извън тях. За да предложим конкурентно предимство като учени по данни, трябва да можем да разпознаваме модели и да синтезираме големи количества информация, използвайки двете страни на нашия мозък. И трябва да сме иновативни мислители. Много от най-добрите резултати са резултат от интеграцията на левия и десния мозък.

Тя също така подчерта защо ясно е да се комуникира визия:

Като учени по данни, нашата цел е да използваме данни, за да помогнем на нашите клиенти да увеличат печалбата си. Повечето ръководители не разбират какво правим или как го правим. Затова трябва да мислим като лидери и да съобщаваме своите констатации и препоръки на език, който нашите заинтересовани страни разбират и се доверяват.

Дузината на данните

Основните съвети включват по-голям брой технически инструменти, умения и възможности, както и по-малко измерими качества като способност за креативност и лидерство. В крайна сметка това не е просто игра с числа. Тъй като науката за данни не се състои само в създаването на модели във вакуум, а в създаването на практически приложения за решаване на реални проблеми на бизнеса за бизнеса, тези, които ще успеят в тази област, трябва не просто да овладеят технологиите, но да познават своята бизнес област и да разберат нуждите на различните членове на екипа на работа.