Тези точки за болка пречат на компаниите да приемат задълбочено обучение

Видео: More than Coffee: как войти в IT и остаться в живых. Отвечаем на ваши вопросы. Java и не только.

Съдържание

Бизнес приложения на задълбочено обучение
V на големи данни и дълбоко обучение
Без грешки, без стрес - Вашето стъпка по стъпка ръководство за създаване на софтуер, променящ живота, без да разрушава живота ви
Дилемата на черната кутия
регулиране

Източник: Agsandrew / Dreamstime.com

За вкъщи:

Дълбокото обучение може да предложи много на бизнеса, но мнозина все още се колебаят да го възприемат. Тук разглеждаме някои от най-големите му болкови точки.

Дълбокото обучение е подполе на машинното обучение, което (най-общо казано) е технология, която е вдъхновена от човешкия мозък и неговите функции. За първи път въведено през 50-те години, машинното обучение е кумулативно информирано от изкуствената невронна мрежа, множество от взаимосвързани възли за данни, които колективно формират основата на изкуствения интелект. (За основите на машинното обучение, вижте Машинното обучение 101.)

Машинното обучение по същество позволява на компютърните програми да се променят, когато бъдете подканени от външни данни или програмиране. По природа тя е в състояние да постигне това без човешко взаимодействие. Той споделя подобна функционалност с извличане на данни, но с извлечени резултати, които да се обработват от машини, а не от хора. Той е разделен на две основни категории: контролирано и неподдържано обучение.

Контролираното машинно обучение включва извеждането на предварително определени операции чрез етикетирани данни за обучение. С други думи, контролираните резултати са известни предварително от (човешкия) програмист, но системата, която извежда резултатите, е обучена да ги „научава“. За разлика от тях, непроучваното машинно обучение извлича изводи от незабелязани входни данни, често като средство за откриване на неизвестни модели.

Дълбокото обучение е уникално по своята способност да тренира себе си чрез йерархични алгоритми, за разлика от линейните алгоритми на машинното обучение. Йерархиите на задълбоченото обучение са все по-сложни и абстрактни, тъй като се развиват (или „учат“) и не разчитат на контролираната логика. Най-просто казано, дълбокото обучение е високо напреднала, точна и автоматизирана форма на машинно обучение и е начело на технологиите за изкуствен интелект.

Бизнес приложения на задълбочено обучение

Машинното обучение вече често се използва в няколко различни индустрии. Социалните медии например го използват за обработка на емисии на съдържание в срокове на потребителите. Google Brain е основана преди няколко години с намерението да произвежда задълбочено обучение в редица услуги на Google с развитието на технологията.

С фокуса си върху прогнозната аналитичност, полето на маркетинга е особено инвестирано в иновации за задълбочено обучение. И тъй като натрупването на данни е това, което движи технологията, индустрии като продажби и поддръжка на клиенти (които вече притежават множество богати и разнообразни клиентски данни) са поставени по уникален начин, за да ги приемат на нивото на земята.

Ранното адаптиране към задълбоченото обучение може много да бъде ключов определящ фактор за това, доколко конкретни сектори се възползват от технологията, особено в най-ранните й фази. Независимо от това, няколко специфични точки на болка пречат на много предприятия да се насочат към инвестиции в технологии за дълбоко обучение.

V на големи данни и дълбоко обучение

През 2001 г. анализатор за META Group (сега Gartner) от името на Doug Laney очерта това, което изследователите възприемат като трите основни предизвикателства на големите данни: обем, разнообразие и скорост. Повече от десетилетие и половина по-късно, бързото увеличаване на точките за достъп до интернет (дължащо се до голяма степен на разпространението на мобилни устройства и възхода на IoT технологията) изведе тези проблеми на преден план за големите технологични компании, както и за по-малкия бизнес и стартъпи, така. (За да научите повече за трите v, вижте днешните големи данни за предизвикателство на стъблата от разнообразие, а не обем или скорост.)

Без грешки, без стрес - Вашето стъпка по стъпка ръководство за създаване на софтуер, променящ живота, без да разрушава живота ви

Не можете да подобрите уменията си за програмиране, когато никой не се интересува от качеството на софтуера.

Последните статистически данни за използването на глобални данни са потресаващи. Проучванията показват, че приблизително 90 процента от всички данни в света са създадени само през последните няколко години. Според 2016 г., мобилният трафик в световен мащаб възлиза на около седем екбабайта на месец през 2016 г. според една оценка, като се очаква този брой да нарасне с около седем пъти през следващото половин десетилетие.

Отвъд обема, разнообразието (бързо нарастващото разнообразие на типове данни с навлизането и разширяването на нови медии) и скоростта (скоростта, с която електронните медии се изпращат до центрове за данни и хъбове) също са основни фактори в начина, по който предприятията се адаптират към нарастващото поле на дълбокото учене. И за да се разшири в мнемоничното устройство, няколко други v-думи бяха добавени към списъка с точки за болка с големи данни през последните години, включително:

Валидност: Измерването на точността на входните данни в големите системи за данни. Невалидни данни, които остават неоткрити, могат да причинят значителни проблеми, както и верижни реакции в машинно учене.
Уязвимост: Големите данни естествено предизвикват проблеми със сигурността, просто по силата на мащаба. И въпреки че в системите за сигурност, които се осигуряват чрез машинно обучение, се наблюдава голям потенциал, тези системи в настоящите им прераждания се отбелязват поради липсата на ефективност, особено поради склонността им да генерират фалшиви аларми.
Стойност: Доказването на потенциалната стойност на големите данни (в бизнеса или на друго място) може да бъде значително предизвикателство поради различни причини. Ако някоя от другите точки на болка в този списък не може да бъде ефективно адресирана, тогава те в действителност могат да добавят отрицателна стойност към всяка система или организация, може би дори с катастрофален ефект.

Други алитеративни точки на болка, които са добавени в списъка, включват променливост, истинност, променливост и визуализация - всички те представят свои собствени уникални набори от предизвикателства пред големите системи за данни. И още може да се добави, тъй като съществуващият списък (вероятно) намалява с течение на времето. Въпреки че на някои може да изглежда малко измислено, мнемоничният „v“ списък обхваща сериозни проблеми, пред които са изправени големи данни, които играят важна роля в бъдещето на задълбоченото обучение.

Дилемата на черната кутия

Една от най-атрактивните характеристики на дълбокото учене и изкуствения интелект е, че и двете са предназначени да решават проблеми, които хората не могат. Същите явления, които би трябвало да позволят, обаче, също така представляват интересна дилема, която идва под формата на това, което е известно като „черна кутия“.

Невронната мрежа, създадена чрез процеса на дълбоко учене, е толкова обширна и толкова сложна, че сложните й функции по същество са неразборни за човешкото наблюдение. Учените и инженерите на данни може да имат задълбочено разбиране на това, което навлиза в системите за задълбочено обучение, но как по-често стигат до решенията си за изход, не са напълно необяснени.

Въпреки че това може да не е съществен проблем за, да речем, за маркетолозите или продавачите (в зависимост от това, което те продават или продават), други индустрии изискват определено количество валидиране на процеса и разсъждения, за да извлекат полза от резултатите. Компанията за финансови услуги например може да използва задълбочено обучение, за да създаде високоефективен механизъм за оценка на кредитите. Но кредитните оценки често трябва да се предлагат с някакво устно или писмено обяснение, което би било трудно да се формира, ако действителното уравнение на кредитния скоринг е напълно непрозрачно и необяснимо.

Този проблем се разпростира и в много други сектори, по-специално в сферите на здравето и безопасността. Медицината и транспортът биха могли да се възползват както по основните начини от задълбоченото учене, но и да се изправят пред значително препятствие под формата на черната кутия. Всички резултати от резултатите в тези полета, без значение колко полезни, биха могли да бъдат напълно отхвърлени поради пълната неизвестност на техните алгоритми. Това ни отвежда до може би най-противоречивата болка от всички тях ...

регулиране

През пролетта на 2016 г. Европейският съюз прие Общия регламент за защита на данните (GDPR), който (наред с други неща) предоставя на гражданите „право на обяснение“ за автоматизирани решения, генерирани от системи за машинно обучение, които „значително влияят“ върху тях. Регламентът, който ще влезе в сила през 2018 г., регламентът предизвиква безпокойство сред технологичните компании, които са инвестирани в задълбочено обучение заради непроницаемата си черна кутия, което в много случаи би възпрепятствало обяснението, възложено от GDPR.

„Автоматизираното индивидуално вземане на решения“, което GDPR възнамерява да ограничи, е съществена характеристика на задълбоченото обучение. Но притесненията за тази технология са неизбежни (и до голяма степен валидни), когато потенциалът за дискриминация е толкова голям, а прозрачността - толкова ниска. В Съединените щати Администрацията по храните и лекарствата по подобен начин регулира тестването и търговията с лекарства, като изисква тези процеси да останат подлежащи на проверка. Това е създало пречки за фармацевтичната индустрия, както се съобщава за биотехнологичната компания, базирана в Масачузетс, Biogen, която поради правилото на FDA е била възпрепятствана да използва непрекъснати методи за дълбоко обучение.

Последиците от задълбоченото учене (морално, практично и извън него) са безпрецедентни и, честно казано, доста дълбоки. Голяма опасение заобикаля технологията, дължаща се до голяма степен на комбинация от нейния разрушителен потенциал и непрозрачната й логика и функционалност.Ако предприятията могат да докажат наличието на осезаема стойност в рамките на задълбоченото обучение, което надвишава всякакви възможни заплахи или опасности, тогава те биха могли да ни помогнат да ни водят през следващата критична фаза на изкуствения интелект.