Катаванне на вадзе - аналогія з аналітыкай заходзіць занадта далёка

кропельная аналітыка

Дадзеныя, як і вада, паступаюць у розных формах. Чалавечы розум развіўся, каб адфільтраваць большасць дадзеных, якія трапляюць на наш шлях, таму што іх проста так шмат.

Калі вы адкрываеце вочы і вушы, дадзеныя ёсць усюды. Колер сцяны, гук кандыцыянера і пах кавы вашага суседа адносяцца да вільготнасці. Вада ўвесь час знаходзіцца ў паветры, але карысна надаваць ёй вялікую ўвагу.

Калі вада кандэнсуецца ў тумане, гэта прымушае вас гэта ўбачыць і яшчэ больш ускладняе разуменне навакольнага свету. Няпоўныя наборы дадзеных, сапсаваныя дадзеныя, дрэнная навука, ілжывыя высновы і кагнітыўная прадузятасць прымушаюць згубіцца ў тумане.

Дадзеныя падаюць як дождж. Калі застаецца няшмат, гэта дзіка не задавальняе - дастаткова, каб зрабіць машыну бруднай і заблытаць размову. Вы адчуваеце, што выціраеце пляма на акулярах, калі хтосьці выкідвае нейкую выпадковую кропку дадзеных, узятую з нейкай незразумелай крыніцы.

  • Нясвежая вада у неглыбокім сажалцы небяспечна. Дадзеныя, сабраныя з ненадзейных запасаў, ні ачышчаныя, ні нармалізаваныя і пакінутыя ў стагнацыі, могуць лёгка прывесці да памылковых высноў.
  • A ўстойлівая струменьчык вады можа хапіць толькі для таго, каб запоўніць сталовую альбо падтрымаць лясную экасістэму. Усяго тры кропкі дадзеных (колькасць адпраўленых, адчыненых і націснутых лістоў) могуць падтрымліваць маркетынгавую праграму.
  • A больш здаровая плынь дадзеных у выглядзе невялікай рачулкі можна выкарыстоўваць для купання. Бесперапынны паток дадзеных дазваляе параўнальнае параўнанне і гістарычнае параўнанне. Аптымізацыя мэтавай старонкі можа быць ажыццёўлена пры нязменных дадзеных пра пераўтварэнне.
    A сціплая рака можа сілаваць млын, каб пілаваць дрэва альбо здрабніць пшаніцу. Механізму рэкамендацый патрэбны толькі надзейны ўклад з боку некалькіх прытокаў, каб забяспечыць павелічэнне кошту кошыкаў.
  • A вадаспад можа рухаць велізарнае вадзяное кола і дастатковы прыток інфармацыі можа кіраваць дынамічнай сістэмай кантэнту ў рэжыме рэальнага часу.
  • A рака гэта дастаткова шырока і глыбока можа падтрымаць цэлую транспартную галіну. Дастатковая колькасць дадзеных можа плаваць на баржах і грузавых караблях у выглядзе калекцыі печыва з рэкламных сетак, агрэгатараў дадзеных праграм лаяльнасці і брокераў дадзеных.

Калі дадзеныя паступаюць у чаканай колькасці ў чаканы час, яны могуць быць захаваны, накіраваны і выкарыстаны. Ірыгацыйныя сістэмы, плаціны і вадасховішчы ствараюць адчуванне кантролю і дазваляюць будаваць усё большую інфраструктуру з каналамі, шлюзамі і плацінамі. Склады дадзеных пабудаваны на менш даверных патоках.

Чысціня побач з пабожнасцю

Чыстая вада мае жыццёва важнае значэнне для поспеху ў жыцці, ірыгацыі, працы электрастанцый і г. д. Вызначэнне "чыстая" можа змяніцца з мэтай; Гэта нармальна, калі ў вадзе ёсць водарасці, якія астуджаюць электрастанцыю, і гэта непрымальна, калі ў пітной вадзе больш за 10 частак на мільярд мыш'яку.

Дадзеныя аднолькавыя. У дадатку на непасрэдную рассылку не мае значэння тытул чалавека (містэр, місіс, місіс) ... калі вы не адпраўляеце па электроннай пошце дактароў. Але брудныя дадзеныя кожны раз будуць вас сапсаваць.

Як галоўны навуковы супрацоўнік ЗША, Дыджэй Паціл, выказаўся на саміце першага круга кіраўнікоў тэхнічных кіраўнікоў, «Калі вы не думаеце пра тое, як захаваць свае дадзеныя ў чысціні з самага пачатку, вы знаёмыя. Я гэта гарантую. Спроба прыбраць гэта пасля факту зойме як мінімум месяцы ".

Калі нагрэць ваду да кропкі кіпення, яна можа забяспечыць цэлую прамысловую рэвалюцыю. Здаецца, дадзеныя робяць тое ж самае. З таго моманту, як кампутары маглі захоўваць, а таксама разлічваць, дадзеныя збіраліся так хутка, наколькі для гэтага было створана абсталяванне для захоўвання дадзеных.

Возера дадзеных

Калі дадзеныя гэтых прытокаў прасочваюцца праз рухавікі млыноў, усё гэта трапляе ў возера, за плацінай. Паколькі дадзеныя выдаюцца кантралявана, яны сілкуюць турбіны індустрыі апрацоўкі дадзеных; гэтыя гіганцкія рухавікі апрацоўкі дадзеных з такімі імёнамі, як Google і Facebook. Засухі тут не будзе.

І, нарэшце, там глыбокая вада, якая чакае, пакуль аналітык пагрузіцца. Падводнае рыштунак і дзіда-стрэльба ў руцэ, аналітык даследуе глыбіню, выяўляе новыя грунты і выяўляе новыя віды. Гэта вельмі цікавы час стаць даследчыкам дадзеных.

Вось чаму так шмат з іх з'явілася на Саміт eMetrics з 2002 г. Наступная магчымасць - у Бостане, з 27 верасня па 1 кастрычніка 2015 г.

Рэгістрацыя саміта eMetrics

Мост занадта далёка

А што з сілы дадзеных, каб выразаць наступны Вялікі Каньён? Што наконт ледавіковага раставання структураваных дадзеных? Як мы абыходзімся са сцёкавымі водамі ў свеце, які становіцца ўсё больш і больш свядомым?

Гэта пытанні на іншы час і вада пад мостам.

Што вы думаеце?

Гэты сайт выкарыстоўвае Akismet для барацьбы са спамам. Даведайцеся, як дадзеныя апрацоўваюцца каментар.