Напред инерция: Преместване на релационното отвъд традиционното

Автор: Louise Ward
Дата На Създаване: 6 Февруари 2021
Дата На Актуализиране: 1 Юли 2024
Anonim
Напред инерция: Преместване на релационното отвъд традиционното - Технология
Напред инерция: Преместване на релационното отвъд традиционното - Технология

За вкъщи: Водещият Ерик Кавано обсъжда иновациите в технологията на базата данни с експерти Дез Бланчфийлд, Робин Блур и Берт Скалцо.



В момента не сте влезли. Моля, влезте или се регистрирайте, за да видите видеото.

Ерик Кавана: Госпожи и господа, в сряда е в четири източно време. Аз съм в Ню Орлиънс, лятото идва, това означава, че е горещо! Време е за горещи технологии, да, наистина да. Казвам се Ерик Кавана, ще ви бъда домакин. Ще ритна топката тук за Hot Technologies. Темата днес е „Напред инерция: Преминаване на релационното отвъд традиционното.“ Хората, днес имаме трима експерти по база данни, така че всички въпроси, които имате, тежки, не се срамувайте. Днес ви подредихме куп добро съдържание. Има място за вашето наистина, достатъчно за мен. Разбира се, тази година е гореща. Ние говорим за горещи технологии в това шоу, което е партньорство с нашите приятели от Techopedia. И днес стигаме изцяло до основата на управлението на информацията, което разбира се е базата данни. Ще говорим за това как стигнахме до тук, какво се случва днес и какво се случва напред. Много интересни неща се случват.


Очевидно имаме някои сериозни иновации в пространството на базата данни. Беше тихо известно време; ако говорите с някои от анализаторите в бизнеса, бих казал вероятно от годината като, 2005 до 2009 г. или „10, не изглежда, че има прекалено много неща по отношение на иновациите.И изведнъж просто избухна, като джейлбрейк или нещо подобно, и сега се случват всякакви интересни неща. Много от това е заради мащаба на мрежата и всички готини уеб свойства, които правят различни интересни неща. Оттам произлиза концепцията NoSQL. А това означава две различни неща: това означава, че няма SQL, тъй като в него не поддържа SQL, това означава и не само SQL. Има термин „NewSQL“, който някои хора са използвали. Но очевидно SQL - Структурираният език за заявки - наистина е основата, това е основата на заявките.

И е интересно, че всички тези двигатели на NoSQL, какво се случи? Е, излязоха, имаше много вълнение по въпроса и след няколко години, какво започнахме да чуваме всички? О, SQL на Hadoop. Е, всички тези компании започнаха да плескат SQL интерфейси върху своите инструменти NoSQL и всеки, който е в света на програмирането, знае, че това ще доведе до някои предизвикателства и някои трудности, а някои кръстосани проводници и т.н. И така, днес ще разберем за много от тези неща


Има нашите три водещи: имаме Дез Бланчфийлд да се обажда от Сидни, нашият собствен Робин Блуър, който е в Тексас, както и Берт Скалцо, той също е в Тексас. И така, първо ще чуем от Dez Blanchfield Хората, ние ще туитваме на хештега на #HotTech, така че не се колебайте към вашите коментари или вашите въпроси чрез Q&A компонента на конзолата за уебкаст или дори през прозореца за чат. И с това, Дез Бланчфийлд, отнеси го.

Dez Blanchfield: Благодаря ти, Ерик. Здравейте всички. Така че ще опитам да настроя сцената на 30 000 фута гледна точка на вида на случилото се през последното десетилетие и на значителните промени, които сме виждали - или поне на десетилетие и половина така или иначе - на системи за управление на бази данни и някои от въздействията от търговска или техническа гледна точка, както и някои от тенденциите, които сме издържали до късно, и ни водят в разговора, който предстои да водим днес по темата.

Моето изображение на корицата тук е пясъчна дюна и от върха й духа малки вятърни пясъци. И в резултат на това става това, че пясъчната дюна бавно се движи от едно пространство в друго. И е невероятно явление, където тези масивни пясъчни планини с височина 40 и 50 фута, ефективно, те действително се движат. И се движат много бавно, но се движат със сигурност и докато се движат, променят пейзажа. И е нещо, което трябва да гледате, ако прекарвате изобщо време в зона, където пясъчните дюни са нещо естествено. Защото можете да погледнете през прозореца един ден и да разберете, че тази масивна пясъчна планина, малки мънички зърна са се преместили сами по себе си, в действителност и че вятърът бавно я премества от едно място на друго.

И мисля, че в много отношения това е светът на системите от бази данни от доста време. До съвсем, съвсем наскоро, тази много малка смяна под формата на пясъчни зърна, движеща гигантска пясъчна планина под формата на пясъчна дюна. През годините са настъпили малки промени в платформите за бази данни и това беше доста стабилна и солидна среда около системите и платформите от бази данни, чрез мейнфрейм на ерата от средния диапазон. Но от късно, имахме някои доста значими неща с нашите търговски нужди и нашите технически драйвери. Ще ни преведе през тях.

Имам мнение, че основната концепция на база данни, както я познавахме много, много години, и както може би сте чували в лентата за предварително показване, нашите двама експерти, които са на разговор с мен днес, продължиха живота си в това пространство и те са напълно прави в споделянето на хвалебствени права да бъдат там, когато всичко започна в началото на 80-те. Но ние видяхме тази голяма промяна през последното десетилетие и малко, и аз бързо ще ни преведе, преди да го предам на д-р Робин Блур.

Преживяхме това, което аз наричам „по-голямо, по-добро, по-бързо, по-евтино“ преживяване. Както казах, дефиницията на база данни се промени. Пейзажът, в който платформите на базата данни трябваше да отговорят на производителността, както и техническите и търговските изисквания, също се измести. Видяхме това увеличение на търсенето на решения за справяне или с по-сложни търговски, или с по-сложни технически изисквания. И така един наистина бърз поглед върху това, което всъщност означава, според мен, е, че трябва да подредим 90-те години и видяхме технологията на базата данни, повлияна от въвеждането на интернет, и нещо, което наричахме тогава интернет мащаб. Не говорихме само за хора, седнали пред терминали, първоначално харесваха телематичните терминали с вградени физически ers и 132 колони, които излизат на хартия. Тогава ранните терминали за зелен екран, пробиване с клавиатури.

Но знаете ли, нашият свят беше терминали и серийни кабели или мрежови кабели, които дълго време разговаряха с компютри. След това дойде интернет и този експлозивен растеж на свързаността, че не е трябвало да се включвате в компютъра вече. За да стигнете до система от база данни, просто се нуждаете от уеб браузър. Така че технологията на базата данни трябваше драстично да се промени, да се справи с мащаба на всичко - от основните технологии на търсачките, които бяха използвани за индексиране на света, и да съхранява индекс на информация, в примера на мащаба на формата на база данни. И хора като Google и други предоставиха платформа за това. И всички нови видове съхранение на база данни и заявки и индексиране бяха произведени. И тогава имахме музикални сайтове и идват сайтове за филми.

И тогава, през 2000-те, видяхме бумът на дот-ком и това доведе до още по-драматичен взрив в броя на хората, използващи системи, неизменно захранвани от база данни с някаква форма. На този етап, релационните бази данни все още се справят с по-голямата част от натоварването, просто ги поставяме на по-голяма тенекия и някак отидохме до много, много, много големи средни системи, работещи с Unix платформи от хора като IBM и Sun и т.н. , Бутът на dot-com просто направи нещата по-големи и по-бързи от гледна точка на хардуер, производителност и имаше някои значителни промени в двигателите на базата данни, но за по-добра част, все пак беше същото, което видяхме дълго време.

И тогава получихме тази ера на уеб 2.0, както го наричаме. И това беше чудовищна промяна, защото изведнъж се нуждаехме от много по-прости платформи за бази данни и трябваше да има мащаб в хоризонтална форма. И това беше толкова съществена промяна в начина, по който подходихме към идеята какво е база данни. Според мен все още сме наистина догонващи. И сега ние се занимаваме с цялата тази тресавица и казвам, че с положително въртене, а не с отрицателна конотация, това трептене на това, което ние наричаме големи данни, и огромна експлозия, и имам предвид експлозия. Това възмутително изместване вертикално върху графиката на броя на опциите, които имаме, когато говорим за база данни и някаква форма на възможност за релационно запитване.

И интересното е, че лично аз съм на мнението, че смятам, че големите данни наистина са само върхът на айсберга. Обикновено сме малко развълнувани от влиянието на големите данни и типовете избори, които имаме на разположение сега. Имаме всичко от NoSQL двигатели, имаме графични двигатели, имаме всички тези различни видове платформи, на които можем да хвърляме данни и да правим нещата с тях. Дори до момента, в който всъщност един от първите разговори, които проведох с Ерик Кавана, който днес е тук с нас, беше около разговор, свързан с нещо, наречено Apache Drill, което е проект с отворен код, който ви позволява да задавате заявки данни вътре в модела различни типове данни: всичко - от сурови CSE файлове, седящи на твърд диск, до HDFS файлови системи в petabyte мащаб. И знаете ли, тя ви позволява да извършвате тези SQL-стил заявки на структурирани и неструктурирани данни от всички видове вълнуващи растения.

Предстои да видим, че „интелигентната сграда“ се превръща в нещо и бихме искали да мислим, че имаме интелигентни сгради за сигурност и управление на топлината, но говоря за интелигентни сгради, които знаят много повече за това кой сте и къде сте, когато влизате и правите всякакви спретнати неща на това ниво, до интелигентни градове - цели екосистеми на ниво град, които знаят как да правят нещата разумно. И освен това, имаме това невероятно нещо, което не мисля, че никой в ​​света е напълно схванат и това е формата на Интернет на нещата. Според мен всички тези различни промени през последното десетилетие и малко, може би две десетилетия приблизително, ако го закръглим, това просто повлия на света на това, което считаме за бази данни, според мен.

Имаше няколко важни неща, които направиха това възможно дори. Цената на твърдите дискове спадна драстично и в много отношения именно това направи възможно задвижването на някои от референтните архитектури като модела Hadoop, тъй като ние вземаме много данни и ги разпространяваме на много твърди дискове, и правете умни неща с него. И всъщност това, което стана рязко, според мен на релационната база данни или традиционния модел DB единица. И RAM паметта се получи много, много евтино и това ни даде изцяло нова възможност да играем с различни референтни архитектури като в паметта и да правим неща като разделяне на много, много големи буци данни.

И така това ни даде тази малка картина, която разглеждаме сега, която е диаграма, която показва видовете платформи, които са налични, ако сте в пейзажа с големи данни. И е много, много трудно да се чете, а причината за това има твърде много информация за това. Има толкова много опции за създаване, моделиране и производство на начини за поставяне на данни в системи от бази данни под каквато и да е форма и да ги запитвате, и да правите традиционното четене-запис. И не всички са съвместими, всъщност много малко от тях дори отговарят на всеки основен стандарт за стил, но все пак считат себе си за база данни. И ще ви покажа няколко екрана за секунда, за да ви дам някакво разбиране за това, което искам да кажа с преминаването от 90-те години и скалата на интернет към уеб 2.0 и след това целия растеж чрез големи данни. Ако смятаме, че тази ландшафтна графика на технологиите за големи данни е вълнуваща, защото има много опции за нея, нека просто разгледаме една ключова вертикала.

Нека да разгледаме маркетинговите технологии. Ето опциите за системи за управление на бази данни или за управление на данни в рамките само на технологичното пространство, така че технологията, свързана с маркетинга. Сега това беше през 2011 г., така че преди няколко години; преди пет години така изглеждаше пейзажът. Ако се върна накратко един слайд, това изглежда днешният пейзаж на данните в различните марки и предложения, които имаме в технологиите за бази данни. Ето как изглеждаше една вертикала преди пет години, точно в маркетинговите технологии.

Сега, ако отида на днешния изглед, ето как изглежда и е напълно непроницаемо. Това е само тази стена от марки и опции и хиляди и хиляди комбинации от софтуер, който счита, че е в класа на базата данни, който може да улавя, създава или съхранява и извлича данни в различни форми. И мисля, че навлизаме в много, много интересно и смело време, когато навремето можехте да познавате основните марки, бихте могли да познаете пет-шест различни платформи от Oracle и Informix, DB2 и т.н., и да бъдете почти експерт по всички марки, които се предлагаха преди около 20 години. Преди десет години стана малко по-лесно, защото някои от марките отпаднаха и не всички марки можеха да се справят с мащаба на бут-до-ком, а някои компании просто се счупиха.

Днес е абсолютно невъзможно да бъдем експерт по всички съществуващи технологии на базата данни, независимо дали става дума за релационни бази данни или стандартни платформи за управление на бази данни, които познаваме през последните няколко десетилетия. Или вероятно е така, по-модерните двигатели като Neo4j и тези типове. И така мисля, че навлизаме в един много смел свят, където има много възможности и имаме платформи в мащаб на хоризонтална основа, или в паметта, или на диска сега. Но мисля, че е време за предизвикателите на технологиите и бизнес решенията, защото те трябва да вземат някои много големи решения относно технологичните пакети, които в някои случаи са съществували само в продължение на месеци. Осемнадесет месеца вече не е страшно число за някои от по-вълнуващите и нови платформи за бази данни с отворен код. И започват да обединяват платформи и стават още по-нови и вълнуващи.

Мисля, че днес ще проведем страхотен разговор за това как всичко това е повлияло на традиционните платформи за бази данни и как те реагират на него и видовете технологии, които се хвърлят при това. Имайки предвид това, сега ще предам на д-р Робин Блур и ще получавам неговите прозрения. Робин, при теб.

Robin Bloor: Добре, благодаря за това. Да, това е твърде голяма тема. Искам да кажа, че ако просто взехте плъзгане на някоя от илюстрациите, които Дез току-що ви показа, бихте могли да проведете дълъг разговор само за един от плъзгачите. Но знаете, можете да отидете в база данни - аз гледах бази данни, не знам от 80-те години, и можете да разглеждате база данни по различни начини. И едно от нещата, които реших, че ще направя, просто се хвърлих в разговора днес, беше да говоря за причината, която разрушителните неща са се случили на ниво хардуер. И трябва да имате предвид, че наистина много разрушителни неща се случиха и на ниво софтуер, така че това не е пълната картина на нищо, това е просто хардуерно нещо.

Аз също нямаше да говоря особено дълго, просто исках да ви дам хардуерната картина. База данни представляваше възможности за извличане на данни, обхващащи процесора, паметта и диска и това се променя драстично. И причината да го кажа, беше, че се научих да разбирам база данни от гледна точка на това, което всъщност си направил. Знаеш ли, има разлика в латентността между данните, които действително са в процесора, и данните, които се изтеглят в процесора от паметта, и данните, които се изтеглят от диска в паметта и през процесора. И старите архитектури на базата данни просто се опитваха да балансират това. Знаеш ли, те просто казваха: „Е, това става много бавно, ние ще кешираме данните на диска, така че да е в паметта. Ще се опитаме да направим това по наистина точен начин, така че наистина добра част от данните, които искаме, вече да е в паметта. И ние ще пренесем данните в процесора толкова бързо, колкото всъщност можем. “

И базите данни са били писани в старите времена, машините са писани за малки клъстери. И сега, за невежите на паралелизма. Защото, ако ще получите някакво представяне от клъстер, ще трябва да правите различни неща паралелно. Паралелизмът е част от играта, нищо подобно на сега. Просто ще разгледам случилото се.

На първо място, диск. Ами дискът свърши, наистина. Почти е по отношение на базите данни. Мисля, че има редица минуси за архивиране на данни и дори много големи лакове за данни, работещи на Hadoop, най-лошият въртящ се диск вероятно е жизнеспособен в наши дни. Наистина проблемът с въртящия се диск беше, че скоростите на четене не се подобриха особено. А когато процесорът вървеше по-бързо, законовите скорости на Мур, някакъв порядък, по-бързи на всеки шест години. И паметта някак си следеше, тогава тези двамата разумно вървяха един към друг, не беше съвсем гладко, но те направиха.

Но случайното четене на диск, където главата лети около диска, искам да кажа, че освен всичко друго, това е физическо движение. И ако правите произволни четения от диск, това е невероятно бавно в сравнение с четенето от паметта, това е като 100 000 пъти по-бавно. И сравнително наскоро повечето архитектури на базата данни, които разгледах в каквато и да е дълбочина, всъщност просто серийно четат от дискове. Наистина искате по един или друг начин просто да кеширате колкото можете от диска и да го извадите от това бавно устройство и да го поставите на бързо устройство. И има много интелигентни неща, които можете да направите с това, но всичко е приключило.

А солидните дискове или флаш дисковете наистина са това, което са, много бързо заместват въртящия се диск. И това отново се променя напълно, защото начинът, по който данните се организират на диск, той е организиран според начина, по който работи диска. Всъщност става въпрос за глава, движеща се по въртяща се повърхност, всъщност множество глави, движещи се по множество въртящи се повърхности, и събиране на данните, докато вървят. Solid-state устройството е само блок от неща, които можете да четете. Искам да кажа, първото нещо е, че всички традиционни бази данни бяха проектирани за въртящ се диск и сега те са реинженерирани за SSD. Новите бази данни вероятно могат - всеки, който в момента пише нова база данни, вероятно може да игнорира въртящия се диск, а не да мисли за това. Но Samsung, основният производител на SSD, ни казва, че всъщност SSD са на кривата на закона на Мур.

Те вече бяха, според мен, около три или четири пъти по-бързи от въртящия се диск, но сега те ще стават доста по-бързи на всеки 18 месеца. Удвоена скорост и 10 пъти по-бърза до около шест години. Ако обаче това беше само това, не е това, както ще ви кажа след малко. Развиващият се диск разбира се се превръща в архивиращо средство.

Относно паметта. Първи неща първо, RAM. Съотношението на процесора между RAM на процесор непрекъснато се увеличава. И това, разбира се, по някакъв начин осигурява ужасно много по-голяма скорост, защото декарите памет, които можете да имате сега, могат да съхраняват много повече. Това, което всъщност прави, е, че намалява налягането върху приложения от типа на MLTP или случайно четените приложения, защото е по-лесно да ги обслужвате, защото сега имате много памет и по този начин можете да кеширате всичко, което е вероятно ще бъде прочетена в паметта. Но се сблъсквате с проблеми с по-голяма грамада от данни, така че големите данни всъщност не са толкова прости, всъщност.

И тогава имаме Intel с 3D Xpoint, а IBM с това, което наричат ​​PCM, което е фаза с промяна на паметта, доставят нещо, което според тях е - е, поне 10 пъти по-бързо от сегашните SSD дискове и те вярват, че ще се получи много близо до същата скорост като RAM. И разбира се е по-евтино. И преди това имахте тази структура на базата данни на процесора, паметта и диска, а сега се движим към структура, която има четири слоя. Има CPU, памет или RAM, а след това този вид по-бърза от SSD памет, която всъщност е нестабилна и след това SSD. И тези нови технологии са нестабилни.

А има и меморист на HP, който все още не е, знаете, защото той беше обявен преди около седем години, но все още не се появи. Но слуховете, които чувам, са, че HP ще промени играта малко с меморитор, така че имате просто нова памет. Това не е, че имаме по-бързи неща, това е като имаме нов нов слой. И тогава ние имаме факта, че SSD достъп, можете да го прочетете паралелно. Не можете да четете въртящ се диск паралелно, освен ако имате много различни въртящи се дискове. Но блок от SSD, всъщност можете да четете паралелно. И тъй като можете да прочетете това паралелно, той върви далеч по-бързо от неговите прости скорости на четене, ако всъщност настроите множество процеси в различните процеси в един процесор и просто разполагате с него със SSD.

Смята се, че можете да достигнете почти до скоростта на RAM, като направите това. И всичко, което това говори е, бъдещето на архитектурата на паметта не е ясно. Искам да кажа, реалността е, че различните доминиращи доставчици, които и да се окажат, вероятно ще определят посоката на хардуера. Но никой не знае къде отива в този момент. Разговарях с някои инженери на базата данни, които казват: „Не се страхувам от случващото се“, но те не знаят как да го оптимизират от първа работа. Винаги сте го правили, така че това е интересно.

И тогава има процесор. Е, многоядрените процесори не бяха само многоядрени процесори. Имаме и значителни обеми от кеш на L1, L2 и L3, по-специално L3, което е, не знам, десетки мегабайти. Можете да поставите много там, знаете. Ето защо можете да използвате чипа като средство за кеширане. Това промени играта. И със сигурност, векторната обработка и компресирането на данни, редица доставчици всъщност са направили това, влачат тези неща в процесора, за да вървят много по-бързо в процесора. Тогава получавате факта, че добре, процесорите с графични процесори наистина са добри в ускоряването на аналитиката. И наистина са много добри в определени видове заявки, просто зависи от това какво е вашето запитване.

Можете или да създавате дъски с процесори и графични процесори, или както AMD прави в момента, вие произвеждате нещо, наречено APU, което е вид брак на процесор и графичен процесор; има и два вида способности по него. Това е различен вид процесор. И тогава неотдавнашното съобщение на Intel, че ще поставят FPGA на чипа, това ми направи главата. Аз си мислех: „Как така, това ще стане?“ Защото, ако имате възможност за процесор, графичен процесор и имате възможност за процесор, FPGA - и между другото, ако наистина искате, на същата платка бихте могли да поставите процесор, и графичен процесор, и FPGA. Нямам идея как всъщност бихте управлявали нещо по този начин, но знам за компании, които правят такива неща, и те получават много, много бързи отговори на заявки. Това не е нещо, което няма да се игнорира, това е нещо, което ще бъде използвано от утвърдените доставчици и може би от новите доставчици, които се появяват. СУБД винаги са били паралелни, но сега паралелните възможности току-що избухнаха, защото това ви позволява да паралелизирате това с това, с това, с това по различни начини.

И накрая, за да мащабирам или мащабирам? Мащабирането е наистина най-доброто решение, но за едно. Получавате далеч по-добра производителност на възлите, ако можете просто да оптимизирате производителността на процесора и паметта на диска в един възел. И ще използвате по-малко възли, така че ще бъде по-евтино, нали? И ще бъде по-лесно да се управлява За съжаление, това е хардуерно зависим дизайн и тъй като хардуерните промени се правят все по-малко възможно, освен ако вашите инженери няма да могат да работят толкова бързо, колкото хардуерът се променя. И вие получавате проблеми с натоварването, защото когато увеличавате мащаба, правите различни предположения за това какво работно натоварване ще направите.

Ако мащабирате, тоест, ако архитектурата ви набляга на мащаба преди мащабирането - всъщност трябва да ги направите и двете, просто ще подчертаете едното. Тогава ще получите по-добра производителност на мрежата, защото архитектурата ще се справи с нея. В хардуерно отношение ще бъде по-скъпо, защото ще има повече възли, но ще има по-малко проблеми с натоварването и ще има по-гъвкав дизайн.

И аз просто мислех, че ще вкарам това, защото ако всъщност мислите за всички хардуерни промени, аз просто насочих пръста си към, а след това се замислихте, как ще мащабирате и мащабирате тези неща? Тогава осъзнавате, че инженерите на бази данни според мен са поне недостатъчно платени. Така че, ако просто обмисляте хардуерния слой, предизвикателствата пред базата данни са ясни. Сега предавам това на Берт, който ще ни накара всички да се чувстваме образовани.

Ерик Кавана: Това е! Бърт?

Берт Скалцо: Благодаря ти много. Нека просто вляза направо в тези слайдове. Имам много слайдове, през които да премина, така че на доста от тях може да отида доста бързо. Ще говорим за този „Напред инерция: Преместване на релационното отвъд традиционното.“ Вече не е база данни на баща ви Нещата се промениха и както каза по-рано говорител, през последните шест до седем години пейзажът се промени коренно.

Самият аз правя бази данни от средата на 80-те. Писал съм книги за Oracle, SQL Server, сравнителен анализ и много други неща. „Светът се променя много бързо. Големите вече няма да бият малки. Това ще бъде бързото побеждаване на бавния. ”Добавих„ за адаптиране ”. Това беше от Рупърт Мърдок. Наистина вярвам, че това ще бъде истина. Няма да можете да правите неща в базата данни както преди 10, 15, 20 години. Ще трябва да го направите по начина, по който бизнесът иска сега.

Ще се опитам да остана малко общ в това, което представям, но повечето функции, за които говоря, ще намерите в Oracle, ще намерите в SQL Server, MySQL, MariaDB и някои от другите големи плейъри. Революцията на релационната база данни, аз отново съм съгласен с по-ранните говорители. Ако погледнете точно около 2010 г., преминахме от червената състезателна кола към жълтата състезателна кола. Имаше значителна промяна и ела 2020 г., вярвам, че ще видите друга радикална промяна. Намираме се в много интересно време.

Сега този слайд е ключов, затова поставих ключ горе. Всичко това се случва и от лявата страна имам технология, а от дясната имам бизнес. И въпросът е кой причинява кой и кой подкрепя кой? Ние имаме всички тези хардуерни промени: слизане на дискове, увеличаване на размера на дисковете, нови видове дискове, така че това беше обхванато от по-ранните говорители. Отпадането на цената на паметта, всички тези по-нови версии на бази данни. Но от дясната страна имаме защита и спазване на данните, съхранение на данни, бизнес разузнаване, анализи, задължително съхраняване на данни. И двете страни на уравнението са движещи се и двете страни на уравнението ще се възползват от всички тези нови функции.

На първо място, ние имаме нашия типичен въртящ се диск SAS, те вече са до 10 терабайта. Ако не сте виждали, Western Digital, HGST разполага с това, което наричат ​​хелиево устройство, което достига до около 10 терабайта в момента. Разходите за предене на диск стават доста ниски. Както бе споменато по-рано, можете да получите твърдотелни дискове до около два терабайта, но Samsung има 20-терабайтно устройство, което идва скоро. Разходите стават разумни. Едно нещо, което ще говоря за другите, което не е, е концепцията за флаш дискове. PCIe, това е PCI Express, спрямо NVMe, може да сте чували или не, неелатилен експрес в паметта. По принцип NVMe ще бъде заместител на SAS и SATA и всъщност е повече от комуникационен протокол от всичко друго. Но тези дискове вече са до около три терабайта.

Може би сте виждали също така, че някои SAS дискове сега се предлагат с U.2 конектори, което е нещо като различен конектор от SAS или SATA, който поддържа NVMe със стандартен диск - дискът, разбира се, трябва да го поддържа. И след това SATA с M.2 конектори и тези започват да получават NVMe. Всъщност има продавачи на преносими компютри, които сега продават тетрадки, които имат в себе си NVMe флаш диск и тези неща ще крещят в сравнение с технологията, която сте използвали преди.

Много хора не знаят какви са всички тези различни проблясъци. Ако погледнете в долния десен ъгъл, това е пример за M.2. Може да кажете: „Ами, изглежда, много прилича на mSATA устройството вляво от него.“ Но както виждате, има две пропуски в щифтовете, за разлика от един, и е малко по-голям. И също така, M.2 може да се предлага в три различни размера.

И след това PCI Express светкавица и NVMe светкавица. Сега, NVMe светкавицата също е PCI Express, но PCI Express обикновено все още е алгоритъм на контролера от тип SAS или SATA, който е написан за въртящ се диск, а NVMe са алгоритмите или техниките, които са написани специално за флаш. И отново, вие ще видите всички тези.

NVMe предлага доста неща. Мисля, че двете най-големи подобрения са, горе в горния десен ъгъл, латентността е намалена с цели 70 процента. Всъщност виждам дори по-високо от това. Освен това, ако погледнете в долния десен ъгъл, когато операционната ви система говори с NVMe диска, тя преминава през много по-малко нива на софтуер. По принцип преминавате през драйвера на NVMe, който вече е включен в операционната система, и той говори директно с медиите. Има много причини, поради които тази технология ще промени коренно света на базата данни.

И много пъти хората ще кажат: „Е, колко бърза е NVMe?“ Знаете, старите добри времена, през 2004 г. и преди, се вълнувахме, ако разполагахме с Ultra-320 SCSI, 300 мегабайта в секунда. Днешните скорости, много от вас вероятно са на фибри или InfiniBand, и такива са най-добрите. NVMe там отдясно, започва там, където свършват сегашните технологии. Това, с което се захващам е, че PCI Express 3.0 с осем-лентова връзка започва от почти 8000 и ще се покачва, тъй като получаваме по-нови версии на PCI Express, версии четири и така нататък. NVMe няма къде да отиде, освен нагоре.

Сега, какви са някои неща, които се променят в базата данни? Сега в горните десни ъгли на моите слайдове изложих бизнес причините, според които се появи технологията. В този случай, поради съхранение на данни и поради регулаторни причини за задължително запазване на данни, базите данни започват да предлагат компресия в тях. Сега някои бази данни предлагат компресия като добавка, други я предлагат като вградена в стандартната, да кажем корпоративно издание на тяхната база данни, и все пак някои бази данни, като например в Oracle, могат дори да имат още по-добра версия на компресия, която е в, да речем, тяхната платформа Exadata, така че всъщност са изградили хардуер, който може да поддържа много специализирана компресия и този в Exadata, например, получава 40x степен на компресия и затова е много значим. И мисля, че това е задължителното запазване на данни, хората просто искат данни по-дълго. Бизнесът, за да правят анализи и BI се нуждаят от данни за последните 5, 10, 15 години.

Сега още една функция, която започна да се показва точно през този период 2008, 2009, беше разделянето. Отново ще намерите това в бази данни като Oracle, SQL Server и в двете, които трябва да платите за него. В Oracle трябва да закупите опцията за дял, а в SQL Server трябва да сте в изданието на центъра за данни. Това е вашата традиционна техника за разделяне и завладяване и това, което правите е, че имате идеята за логическа голяма маса в горната част там и когато тя бъде пусната на диск, тя всъщност се разпада на кофи. И можете да видите, че тези кофи са организирани по някакви критерии за разделяне, обикновено се отнасят или се наричат ​​вашата функция на дял и след това също можете да подразделяте в някои платформи на базата данни и можете да отидете още по-далеч.

Отново мисля, че както съхранението на данни, така и задължителното задържане на данни са изтласкали това и в някои от тези бази данни можете да имате до 64 000 дяла, а аз вярвам в някои други бази данни дори до 64 000 под-дяла. Това ви позволява да разбиете данните си на управляеми парчета. Вие също ще разделите индексите; това е опция, не е нужно, но можете да разделите и индексите си. Една от причините за това може да е, че имате плъзгащ се прозорец с данни. Искате да запазите данни от 10 години, но за да изпуснете индексите, за да стартирате тази вечер пакетно зареждане, не искате да изпускате индексите на всеки един ред, само на редовете, които са в текущата група. Разделянето всъщност е много добър административен инструмент, въпреки че повечето хора смятат, че голямата му полза е да се премахне елиминирането на дялове във вашите планове и следователно да ускорите вашите заявки. Това е наистина вид череша на тортата.

Вероятно сте чували за затягане и вероятно си мислите: „Е, защо поставихте този слайд тук?“ Това е една от тези NoSQL - това е една от тези среди от типа Hadoop. Oracle 12c пусна два, което все още не е G8, но което се показва или визуализира, всъщност има изостряне. Ще имате традиционна система от бази данни като Oracle и ще можете да разделяте, както при модела Hadoop, и така ще имате друга техника за разделяне и завладяване, която ще раздели вашата таблица по ред в групиране по възел и това ще бъде - точно като това, което виждате в някои от вашите бази данни NoSQL. И всъщност MySQL, всъщност можете да постигнете това почти с помощта на една от техните техники за клъстеринг, но той стига до традиционната база данни и предполагам, че Microsoft няма да иска да остане назад. Тези двама играят скачаща жаба помежду си през цялото време, така че бих очаквал да видя изостряне в може би следващата версия на SQL Server.

Управление на жизнения цикъл на данните, отново задължително запазване на данни, но също така и за бизнес разузнаване и анализи. Наистина това е техника за разделяне и завладяване и обикновено DBA правят това ръчно и това е: „Ще запазя данните за тази година на бързи дискове, миналогодишните данни за малко по-бавни дискове, може би ще продължа да запазя последните две години преди това на още по-бавни дискове и тогава ще имам някакъв архивен метод. ”Обикновено той вече не е записан на лента, обикновено е - имате някакво прикачено към мрежата място за съхранение или устройство, което има много на съхранение и е, знаете ли, е рентабилно, но все още върти диск.

И така сега можете всъщност - и в Oracle, и на SQL Server - можете да закупите опция, при която определяте правилата и това просто се случва автоматично на заден план. Не е нужно повече да пишете скриптове, не е нужно да правите нищо. И ако сте виждали SQL Server 2016, който току-що излезе първи юни, има нова функция, наречена „Stretch Databases“, която по принцип ви позволява да правите - в долния десен ъгъл там - можете да се местите от множество слоеве директно в облака и отново това е функция, която е вградена в базата данни, просто кажете нещо от рода на: „Ако данните са на повече от 365 дни, моля, преместете ги в облака и, знаете ли, направете го автоматично за мен.“

Това ще бъде наистина готина функция, всъщност аз мисля, че може би ще бъде това, което ще видим в бъдеще, което е, че ще имате хибридни бази данни, където ще запазите някои локални а някои в облака. Преди това хората си мислеха: „О, аз или ще направя на място или ще направя в облака.“ Сега виждаме брака на двете технологии по този хибриден начин. Мисля, че това ще бъде доста голямо и Microsoft стигна първо там.

Реакция, това се дължи на защита и спазване на данните. Сега в добрите стари времена може да сме казали: „Ей, разработчика на приложения, когато показвате това в отчета, когато показвате това на екрана, тук са някои неща за сигурността, които трябва да проверите и, моля, знаете, да показвате само данните те трябва да виждат или маскират или редактират данните, които те не трябва да виждат. "Е, както обикновено, когато го изтласкате към приложението, това не се прави на едно място, така че става по различен начин или не На някои места няма да свърша. И сега вие всъщност имате тази възможност в системите си от бази данни.

Сега в SQL Server 2016 тази функция е вградена, така че все още не е задължителна ставка на разходите, която да бъде добавена в центъра за данни; и в Oracle 12 трябва да закупите тяхната добавка за управление на жизнения цикъл, но това е нещо ново и отново се ръководи от бизнеса. И най-вече защото съхранявате толкова много данни сега и правите извличане на данни, така че BI и анализите, трябва да знаете кой има достъп до какви данни и да се уверите, че те могат да виждат само какво имат право да виждат

По същия начин, погледнете отново това, защитата на данните и спазването. Ще разберете, че много от системите за бази данни сега изграждат компресия или съжалявам, криптиране директно в базата данни и какво е важно за това криптиране, ако погледнете стрелката надолу и стрелката нагоре на диаграмата, в която я пише надолу до криптиран диск и след това той го чете обратно в паметта и го дешифрира. Това е всъщност един модел, има друг модел, който всъщност ще го направи само когато съобщи тези данни в мрежата на действителното клиентско приложение.

В този случай дори на сървъра на базата данни в паметта може да бъде криптиран и дешифриран само когато бъде изпратен към клиентското приложение. Тук има два различни модела и ще ги намерите в базите данни, а всъщност една от базите данни, която току-що добави това, беше MariaDB в тяхната версия 10.X; Вярвам, че сега са на 10.1 или 10.2. И всъщност направих някои сравнителни показатели за това криптиране и за да получа това криптиране, аз само изпитах около 8 процента намаление на пропускателната способност или скоростта. При тест за сравнителен анализ криптирането не предизвика толкова много и затова е много полезна функция.

Сега споменахме по-рано за флаш паметта и SSD дискове и подобни неща. Една от функциите, които имате в Oracle и SQL Server, които много хора не осъзнават, е, че можете да вземете флаш или SSD, който е на вашия сървър на базата данни, и можете да кажете на базата данни: „Използвайте това, сякаш са памет. Отнасяйте се към оперативната памет като преференциална, но се преструвайте, че това е бавна памет и я използвайте като разширен кеш. ”Сега в SQL Server 2014 това излезе и беше наречено„ Buffer Pool Extension ”- безплатно е. В Oracle той излезе в 11g R2 и беше наречен „Database Flash Cache“ и там също беше безплатен.

Моят съвет обаче е да тествате внимателно тази функция. Всеки път, когато увеличите кеша, когато отидете да направите търсене, това отнема повече време. Ако сложите три терабайт флаш карта и кажете на базата данни „Добавете това към паметта си“, всъщност може да откриете, че нещо се е забавило поради времето, в което да погледнете и да видите дали е на светкавица, мръсно ли е или чиста? Има точка на намаляваща възвръщаемост. Моят съвет е отново тест драйв това, вижте какво работи за вас, но отново, той е във вашата база данни и в случай на Oracle, както в SQL Server, така и в Oracle, той е там от няколко години.

И тогава това ни отвежда до дядото, който беше базите данни в паметта и това е така, защото цените на базата данни паднаха. Другата причина, поради която вероятно бихте си помислили, че това е станало, е голяма част от анализите, които изискват данните да са много бързо достъпни и затова тя трябва да бъде в паметта. Имайте предвид, че алгоритмите, които базите данни използват за достъп до тези данни, за компресиране, за криптиране, за съхраняване, знаете, че в някои случаи някои бази данни могат да продължат да съхраняват в паметта като ред.

В някои случаи някои бази данни могат да разбият това на колона, ориентирана и причината да направят това е, че получават много по-високо ниво на компресия, някъде около 11 до 12X, като го съхраняват в ред колони спрямо ред на реда. Това за пръв път се появи в SQL Server 2014, беше наречено „Хекатон“. Тя беше радикално увеличена през SQL Server 2016, те ще я видят от някои различни имена и излезе в Oracle 12c; Казвам второто издание тук, а не R2. Имаше две различни версии на Oracle 12c, 12.1.0.1 и 12.1.0.2. Това е второто издание на R1 версията на базата данни.

И начинът, по който го дефинирате, обектът в паметта е подобен и в двете бази данни. Тук можете да видите в десния горен ъгъл, аз създавам SQL Server и можете да видите, че той казва с оптимизирана памет и издръжливост е само схема. Няма да преразглеждам всички тези значения на синтаксиса и в Oracle това е всъщност още по-просто, просто променяте таблица и казвате в памет или не и можете да промените това. Мога да кажа, че днес е в паметта, а утре не е и затова е много гъвкава.

Направих някои тестове на Oracle с таблици в паметта, имах няколко теста, които отнеха почти 40 минути, до горния ред. Важното е, че когато стигна до долните два реда, бях увеличил времето на изпълнение или го намалих, трябва да кажа, приблизително до пет минути и когато погледнах коефициента на компресия, данните в паметта всъщност бяха 3.6 до 4,6 пъти по-малък. Това е важно, защото в този случай използвах ориентиран към колона формат и той е компресиран. И така познайте какво? Всъщност вписвах почти четири до пет пъти повече данни в паметта си. Не само получих предимството на вградената памет, предимството на ориентацията на колоните, но и предимството на далеч повече данни - до пет пъти повече данни в кеша на паметта, така че това е доста мощна техника. Отново Oracle и SQL Server, които искате да разгледате, те са наистина страхотни функции. И с това, мисля, че ще го отворя за въпроси.

Ерик Кавана: Е, Берт, на първо място си бил много безкористен в това прекрасно образование. Бихте ли поговорили само за минута какво правите? Защото имате някаква улесняваща технология, която може да улесни това, за което сте говорили. Просто поговорете за минута за това, което правите, и тогава нека да свалим Дез и Робин в уравнението тук.

Берт Скалцо: Да, работя за компания, наречена IDERA. Ние сме в Тексас, със седалище в Хюстън и всъщност седя в момента в Остин, но съм със седалище в Далас. Ние правим инструменти за база данни и правим инструменти за база данни, за да ви помогнем да решите проблеми. Този проблем може да бъде нещо толкова просто, колкото производителността. В този случай имаме инструмент, наречен DBArtisan, който ви позволява да извършвате административни задачи на вашата база данни и това е един инструмент, който ви позволява да управлявате 12 различни платформи за бази данни. Мога да управлявам SQL Server, мога да управлявам Oracle, мога да управлявам MySQL, DB2, Postgres и използвам един инструмент, един изпълним файл, един GUI дизайн и един последователен набор от работни процеси. Ние също така правим инструменти за спазване на изискванията, имаме инструмент, наречен SQL Compliance Manager, който да ви помогне да удовлетворите вашите нужди за съответствие. Друг инструмент, наречен SQL Security, затова се опитваме да направим инструментите, които ще ви помогнат да бъдете ефективни и ефикасни, и какво наистина е хубаво, ако отидете на нашия уебсайт, ние имаме цял куп безплатни файлове там, така че ако нищо друго, отидете да изтеглите - Мисля, че имаме около 20 или 25 автостради. Има някои наистина добри безплатни неща, като например, че има SQL сървър и помощна проверка на Windows, които в общи линии просто ще разгледат какво имате и ще ви кажат дали имате проблеми или неща и е напълно безплатно.

Ерик Кавана: И вие наистина сте ...

Берт Скалцо: Определено първите неща -

Ерик Кавана: Говорите за хетерогенността на пазара днес, имаше някакво уравнение с еднакви размери, което всъщност си спомням, че интервюирах д-р Майкъл Стоунбракър още през 2005 г., когато той продължи с голям тласък говорейки за присъда за движението на базата данни, ориентирано към колоната, и говореше за това как релационният модел с един размер отговаря на всички доминира в продължение на много години и той предвиждаше, че всичко това ще се промени и момче беше прав за това. Сега имаме тази наистина разнообразна и интересна среда с много различни опции и възможности, но имате нужда от някой, който да управлява всичко това и ми се струва, че вашата компания е съсредоточена доста остро върху решаването на математически проблеми, като по този начин е активист на заглавка на хетерогенност, нали?

Берт Скалцо: Абсолютно. Искам да кажа, че винаги ще има DBA, които казват: „Не искам да използвам GUI инструмент, правя всичко със скриптове“, знаете ли? Те смятат, че са типът DBA на супермен и това е добре, но за повечето от нас хората искаме просто да свършим работата си и - знаете, аз използвам Microsoft Word за писане на документите си. Използвам Microsoft Outlook, за да направя своето. Искам да кажа, че имам инструменти за изпълнение на задачи. Ние изграждаме същия тип концепция, създаваме инструменти за администратори на бази данни и разработчици, за да им помогнем да се съсредоточат върху това, което искат да правят, а не как трябва да го правят.

Ерик Кавана: Това има смисъл, но позволете ми да ви предам нашите експерти и хората се чувстват свободни да се гмуркат. Имаме няколко коментара, идващи от публиката. Може би, Дез, няколко въпроса и Робин няколко въпроса?

Dez Blanchfield: Сигурен. Един от първите въпроси, които искам да ви хвърля, предвид огромния период от опит, който имате, виждате ли скоро момент, когато някой от това ще се забави? Или смятате, че наистина сме точно на входната точка на тази непрекъсната линия на растеж на промяна? Мисля, че един от най-големите проблеми, с които се сблъскват компаниите, а след това неизменно хората, които се опитват да подкрепят технологията, предоставяна на тези компании да управляват бизнеса си, е, че скоростта на промените е толкова драматична, че просто не могат да бъдат в крак с всички различните функции, и софтуер, и системи, и рамки, и архитектури, и нов код, и след това хардуерът под него, виждате ли, че текущата скорост на промяна изобщо се забавя? Искам да кажа, че се занимавате с толкова широка гама от платформи с целия пакет IDERA, скоро ли ще забавим скоростта или ще се подредим на този луд бягство от товарен влак още?

Берт Скалцо: Мисля, че сме на първите 20 процента от тази крива на растеж и имаме дълъг път и има две неща, които го тласкат. Технологията продължава да се развива. Споменахте някои от новите типове памет, които предстои да излязат, това ще бъде фантастично. Samsung скоро ще има 20-терабайтна флаш памет тук реално скоро. Това ще промени нещата Ние имаме всички тези NoSQL и облачни бази данни, това просто ще продължи. Единственото нещо, което е нещо смешно, е, когато гледам бази данни като Oracle и SQL Server и някои от другите, те вече не са релационни бази данни. Мога да поставя неструктурирани данни в Oracle и все пак да поддържам съответствие с ACID. Ако ми казахте това преди 20 години, просто казах, че сте наркотици.

Dez Blanchfield: Да, да, те са готини. Ами дори сега тези двигатели, които имат доста приятни нишови вертикали като GIS, просто по-добри от сегашните възможности. Направихте няколко страхотни коментара за предизвикателствата, пред които са изпратени DBA, и различните времена на DBA, които се надяваме да видим навсякъде, но как изглежда светът с този вид бизнес, с който се занимавате? Искам да кажа, това са хората, които използват различните платформи от вашия диагностичен мениджър, до инструментите за инвентаризация и чак до следващия до дефрагментирането, как DBA се справят с тази промяна и как те са нещо - знаете ли , какво правят с вашите инструменти, за да се справят с тази значителна промяна в техния пейзаж?

Берт Скалцо: Е, аз ще се върна преди почти 20 години, тогава ще кажа, че DBA решават много специфична роля в една организация. Обикновено работят с една платформа на базата данни, може би две, и те управляват сравнително малък брой бази данни. Сега напред напред към днес и администратора на базата данни, той всъщност ще познава 10 платформи за бази данни. Той управлява и това не е шега, в някои случаи хиляди бази данни; това е повече за света на SQL Server или MySQL. Но все пак в света на Oracle те биха могли да управляват стотици бази данни. И така, те изваждат всички тези нови функции, имат всички тези нови платформи и имат всички тези бази данни, за които отговарят. Те търсят инструменти, които да позволят тяхната производителност, а също и да им помогнат да научат някои неща.

И ще ви дам пример - ако искам да разделям таблица, това е доста неясен синтаксис и ако искам да я подразделям, синтаксисът става още по-труден. Знам какво искам да правя, искам да създавам кофи. Ако имам инструмент като DBArtisan, който казва: „Ей, ето хубав екран, който ви позволява да се концентрирате върху това, което се опитвате да направите, а не върху това, как се опитвате да го направите, и, между другото, натиснете Покажете SQL бутона, когато сте готови и ние ще ви покажем какъв е бил SQL, за да можете да започнете да научавате и овладявате това. “

DBA установяват, че инструменти, които им помагат да свършат работата, но също така помагат да ги научат на всички тези нови неща, които използват и същото би било вярно - да кажем, че съм човек от Oracle и отивам в MySQL и казвам, „Добре, създайте база данни, DBArtisan. А сега ми покажете SQL, защото се чудя какво е да създадете база данни в MySQL и току-що се научих да синтаксисам. “И така ние не само им помагаме да работят в базата данни, но и ги обучаваме в базата данни.

Dez Blanchfield: Става още по-интересно, когато стигнете до някои от по-модерните - или не по-модерни, това не е честно нещо да се казва - но веднъж база данни е база данни. В наши дни виждам всичко, за което говорите там, с допълнителното предизвикателство, че технологията се натрупва, която традиционно виждаме от доставчиците, и вие като вид отворен код в нея, както и че те са добри. Не само се занимавайте с двигателите на базата данни и езиците на заявките, но те се занимават и с типовете данни, структурираните и неструктурирани, знаете ли, предизвикателството да се справите с всичко от далечния край на спектъра на мултипетабайт HDFS среда за малки миниатюрни контейнери и пакетни файлове и различни формати на файловете.

И мисля, че това е нещо, което сега виждаме къде просто няма човешко същество, без значение колко супермен, супер жена, каквото и да мислят за тях, те физически, те просто не могат психически да се справят с тази скорост на промяна и мащаба на вариациите. Мисля, че наборът от инструменти, които предлагате сега, ще стигне до момент, в който те почти ще бъдат по подразбиране от много начини, така че да не можем да стартираме средата на базата данни, която получихме без тях, защото просто физически не може да хвърли толкова много тела към тях. Много ми хареса вашето представяне. Ще отида при д-р Робин Блур, сигурен съм, че има много въпроси да ви хвърли и вас.

Robin Bloor: Добре. Ами със сигурност имам въпроси. Берт, не знам накъде отиваш - имах наистина интересен разговор преди няколко дни, когато някой започна да ми разказва за най-новата защита на данните на DU и ми се стори от това, което казваха, че е невероятно драконов по отношение на нещата, на които са настоявали. Чудех се дали всъщност сте гледали това; нещо познато ли си?

Берт Скалцо: Абсолютно. Да.

Robin Bloor: 2016, Добре, кажи ни за това.

Берт Скалцо: И всъщност съм ...

Robin Bloor: Дълбоко интересно.

Берт Скалцо: Всъщност работих известно време за флаш доставчик, в областта на тяхната база данни, помагайки им да изграждат флаш продукти за бази данни и мога да ви кажа, че драконианът стига докрай надолу. Това, което искам да кажа е, че ако си спомняте моя един слайд, казах в някои бази данни, че ще извърши криптирането, но го вкарва в паметта на сървъра, а в някои бази данни криптирането - все още е криптирано в паметта на сървъра, той се декриптира само когато тя се изпраща до клиента. Е, това, което също ще намерите, е някои от тези правителствени стандарти, особено Министерството на отбраната или военните тук в САЩ, те също стигат до нивото на флаш и искат да знаят не само, че поддържате криптиране и декриптиране в вашия хардуер, но че ако някой открадне чиповете, които - знаете, ги извади от нещата от вашия сървър, че това, което има, е криптирано и така, въпреки че имат хранилището, не може да бъде и те биха чак до действителното - не до самата флаш част, а до отделните чипове. Искаха да знаят този чип по чип, всичко беше криптирано.

Robin Bloor: Еха. Искам да кажа, че има много неща, които - знаете ли, мисля, че сте измислили за това само един или два слайда, но това е нещо, сценарий, който според мен е наистина интересен. Редактирането на информация, например, трябва да е малко по-умно, отколкото просто да маскирате различни области, защото особено с машинното обучение в днешно време можете да правите дедуктивни неща, които ви позволяват да извеждате на повърхността информация, която преди не сте могли да обработвате.

Ако се опитвате да защитите, да речем здравна информация, тогава това са много, много драконични правила в САЩ по отношение на здравната информация, но всъщност можете, използвайки различни техники за машинно обучение, често можете да разберете кой е нечия медицинска информация всъщност е. Просто се зачудих дали имате нещо да кажете по въпроса, защото всички те смятат, че това е интересна област.

Берт Скалцо: Да, абсолютно, и аз просто използвам това като пример, не се опитвам да кажа, че една база данни е по-добра от друга, но това е много добър пример за това, което току-що поискахте. В Oracle, ако не ми бъде позволено да виждам ред данни, например, като нямам право да виждам медицинския запис на Джон Смит. В Oracle, ако кажа: „Изберете този запис“, ще бъда блокиран или ще ми бъде разрешено да виждам това, което ми е позволено и той ще бъде редактиран. И ако кажа: „Изберете звездата на профила от таблицата, която е равна на Джон Смит“, ще получа нула.

В SQL Server той може да направи редакция, но има някои дупки. Ако кажа: „Изберете звездата на профила от таблицата, където тя се равнява на Джон Смит“, всъщност ще получа една, така че знам, че има Джон Смит. Единият е по-сигурен от другия. Сега очаквам те да поправят това, те винаги играят скок жаба помежду си. И отново, аз не се опитвам да разграничавам базите данни, освен да покажа пример - вижте за какво говорим сега, нещо толкова просто като акаунта за избор трябва да бъде съкратено и от редакцията, въпреки че технически говорейки, няма нищо редактирано освен съществуването на реда.

Robin Bloor: Да бе. Това е интересно. Искам да кажа, че друг общ въпрос, тъй като нямам много време, е наистина свързан с подобренията.Искам да кажа, че сте били в един, където знам, че ни показвате примери за различни резултати от тестове, които сте пуснали - мислите ли, че традиционните бази данни, нека ги наречем доминиращите бази данни, SQL Server и Oracle, нали? мисля, че те ще останат пред завършването? Или смятате, че всъщност ще бъдат хванати от едни или други различни видове смущения на пазара, които наистина работят за тях? Какво е вашето мнение?

Берт Скалцо: Имам мнение и това е - знаете ли, пак ще кажа, че е мое мнение - Microsoft например в ерата след Балмер просто впечатлява живия ад от мен. Искам да кажа, че тази разтегателна база данни ще получи SQL Server на Linux, преодоляване на .NET над Linux, PowerShell над Linux; Не мисля, че традиционните доставчици на база данни ще останат назад. Мисля, че са решили: „Ей, нека новите момчета, стартъпите да определят нещо. Нека да разберат какво е изострянето и как трябва да се усъвършенства, и след като направят всички изследвания и разработки, ние знаем точно какво искат потребителите, сега нека добавим изостряне към Oracle. “Мисля, че те просто стават умни и казвайки: „Хей, да си втори или трети не е лошо, когато си доминиращ играч, защото тогава хората няма да мигрират от теб.“

Robin Bloor: Да, искам да кажа, че е използвана стратегия. Искам да кажа, че IBM правеше това и цялото това - за целия им продуктов диапазон и това се оценява доста добре, докато някой не излезе с нещо, което е напълно напълно от стената, за което никой не се сеща, но не можете да планирате срещу това така или иначе.

Въпроси от публиката, Ерик?

Ерик Кавана: Да, но ти имаш време, мисля само за един, и знам, че Берт трябва да бяга. Имаше нещо тук - добре, засилващата се архитектура на Oracle 12c е, че индикация за - или какво е това показание според вас, какво мислите, че се случва там?

Берт Скалцо: Е, Oracle поглъща или предлага всичко, което са всички други доставчици на база данни. Например, мога да поставя неструктурирани данни в Oracle. Не знам как можете да поставите неструктурирани данни и след това да го наречете релационна база данни, така че няма смисъл, но можете. И сега Oracle добавя изостряне, така че Oracle казва: „Знаеш ли какво? Каквото и пазарът иска, ние ще направим нашата база данни, защото пазарът иска това, което пазарът иска и искаме да предоставим решението, искаме те да останат с нас. "

Мисля, че ще видите допълнителни елементи. Не бих се изненадал да видя като Hadoop клъстеризиране на възли на базата данни не в стелаж на Oracle или реален клъстер на приложения, а основно в повече от традиционно клъстериране тип Hadoop, което прави това заточване. И така мисля, че ще можете да разгърнете база данни като Oracle, като Hadoop, и подобни тенденции ще продължат. Тези големи доставчици на база данни, те правят милиарди долари и не искат да губят пазара си, така че те са готови да се адаптират към всичко или да приемат нещо.

Ерик Кавана: Е, знаете, смешно е, защото следя доставчиците с отворен код от доста време и се чудех на всичко това, макар колко голямо влияние ще окаже той върху традиционната технология със затворени врати и известно време се чувствах като доставчиците с отворен код правеха някои сериозни крачки и сега, като гледам пазара виждам вид на това, което казвате, че големите момчета са си направили математика, са заточили моливите си и са разбрали как могат да тъкат много от тези неща в техните архитектури. Независимо дали става въпрос за IBM, или Oracle, или SAP - току-що бях на конференцията SapphireNow миналия месец и Стив Лукас, който оглавява половината от тази компания, се похвали, че SAP сега е включен в облачната си платформа HANA, повече компоненти с отворен код от всички техни конкуренти. Ако се занимавате с математика в това, това е доста впечатляващо твърдение и ми казва, че големите момчета няма да отидат никъде в скоро време.

Берт Скалцо: Не, бих заложил парите си и на двете. Искам да кажа, че ако погледнете, акциите на Microsoft наскоро бяха около $ 50 и, знаете, само преди няколко години беше на 25. Не удвоявате цената на акциите си за кратък период, освен ако не правите добри неща и знайте, че от правенето на всичко от Windows 10, която е безплатна за първата година, и всички останали умни неща, които правят, тази функция на базата на разтягане мисля, че е просто феноменална. Мисля, че това, което ще се случи е, че много хора ще се озоват в Azure, а не директно, не както казаха: „Нека мигрираме моята база данни към Azure.“ Ще мигрира там магически, защото ще се архивира там, използвайки тази нова функция на базата на разтягане, така че приемането на Azure ще нарасне бързо.

Ерик Кавана: Е, това е една от тенденциите на пазара, която дори аз виждам, дори и на вашия Mac. Докато влизате в своя Mac, за да запазите някои документи, те сега - и по-новите Macs просто следват през облака, нали? Искам да кажа, че има много смисъл в тази стратегия и аз също я гледам и си отивам: „Добре момчета, вие се опитвате да ме примамите парче по парче във вашата облачна среда и тогава някой ден, когато искам да гледам някой филм, ако кредитната ми карта е изтекла, ще изпадна в затруднение. “

Берт Скалцо: Да, но го правиш на.

Ерик Кавана: Да. Вярно е.

Берт Скалцо: Вие слагате всичко.

Ерик Кавана: Е, не съвсем всичко.

Берт Скалцо: Не, искам да кажа ...

Ерик Кавана: Да, давай.

Берт Скалцо: Тези социални тенденции достигат до бизнеса. Сега фирмите все още имат много други неща, които трябва да правят, но виждат тези тенденции и правят едни и същи неща. Не виждам нито Oracle, нито Microsoft да си отиват. Всъщност ще купувам склад и на двата пъти, когато има потапяне

Ерик Кавана: Да, именно. Ами хора, отидете на idera.com, I-D-E-R-A точка com. Както Берт каза, те имат цял ​​куп безплатни неща там и това е една от новите тенденции на пазара - дайте ви няколко безплатни неща, с които да си поиграете, закачете се и след това отидете да си купите истинските неща.

Хора, това е поредната гореща технология. Благодаря за отделеното време днес, Берт, Дез, разбира се и Робин. Ще говорим с вас следващата седмица, хора, много неща се случват. Ако имате някакви идеи, чувствайте се свободни към вашите наистина,. Ще говорим с вас следващия път, грижете се. Чао чао.