Cad iad na 'Big Data' go díreach?

Agus Cén fáth a bhfuil sé ina Big Deal?

Is é 'Big Data' an eolaíocht nua tuisceana agus tuar ar iompraíocht an duine trí mhéideanna móra sonraí neamhstruchtúrtha a fhoghlaim. Tugtar 'anailísí réamhfhabhtaíocha' ar shonraí móra freisin.

Tá roinnt samplaí sonraí mór ag anailísiú post Twitter, fothaí Facebook, cuardaigh eBay, rianaithe GPS agus meaisíní ATM. Is foirmeacha eile iad staidéar a dhéanamh ar fhíseáin slándála, ar shonraí tráchta, ar phátrúin aimsire, ar thurais eitilte, ar logs turais fón póca agus ar rianaithe rátaí croí. Is mór-eolaíocht nua é sonraí mór a athraíonn go seachtainiúil, agus níl ach cúpla saineolaithe a thuiscint go léir.

Cad iad na samplaí áirithe de shonraí móra sa saol rialta?

scáileán http://project.wnyc.org/transit-time

Cé go bhfuil an chuid is mó de na tionscadail sonraí móra an-doiléir, tá samplaí rathúla ann de shonraí móra a théann i bhfeidhm ar shaol laethúil daoine aonair, cuideachtaí agus rialtais:

Breitheanna víris a thuar: trí staidéar a dhéanamh ar shonraí soch-polaitiúla, sonraí aimsire agus aeráide, agus sonraí ospidéil / cliniciúla, tá na heolaithe seo ag tuar rátaí fiacha dengue anois le fógra réamhfhógra 4 seachtaine.

Faire Muirí: tá próifílí an tionscadail sonraí mór seo ag íospartaigh dúnmharú, daoine faoi dhrochamhras agus coirpigh i Washington, DC. Mar bhealach chun an t-éagach a urramú agus mar acmhainn feasachta do dhaoine, tá an tionscadal mór sonraí seo suimiúil.

Pleanáil Taistil Idirthurais, NYC: Rinne an clároir raidió WNYC, Steve Melendez, an sceideal subway ar líne le bogearraí taistil taistil. Tugann a chruthú ligean do New Yorkers cliceáil ar a suíomh ar an léarscáil, agus beidh tuar ar am taistil le haghaidh traenacha agus subway.

Laghdaigh Xerox a gcaillteanas fórsa oibre: tá obair lárionaid glaonna ag brath go mothúchánach. Tá Xerox tar éis staidéar a dhéanamh ar thruaistí sonraí le cabhair ó anailísithe gairmiúla, agus anois is féidir leo a thuar cé na hiarrthóirí lárionad glaonna is dócha go bhfanfaidh siad leis an gcuideachta is faide.

Tacú le frithsceimhlitheoireacht: trí mheán na meáin shóisialta, taifid airgeadais, áirithintí eitilte, agus sonraí slándála, féadfaidh forfheidhmiú an dlí réamhshuímh sceimhlitheoireachta a thuar agus a aimsiú sula ndéanann siad a ngníomhartha olc.

Coigeartú margaíochta branda bunaithe ar athbhreithnithe ar na meáin shóisialta : déanann daoine a gcuid smaointe ar líne a roinnt i dteach tábhairne, i mbialann nó i gclub aclaíochta. Is féidir staidéar a dhéanamh ar na milliúin post sóisialta sna meáin shóisialta agus aiseolas a thabhairt don chuideachta ar na daoine a cheapann a gcuid seirbhísí.

Cé a Úsáideann Big Data? Cad a dhéanann siad leis?

Baineann corparáidí monolithic go leor úsáid as sonraí móra chun a gcuid tairiscintí agus praghsanna a choigeartú chun sásamh an chustaiméara a uasmhéadú.

Cén fáth a bhfuil sonraí móra den sórt sin ina Big Deal?

Déanann 4 rudaí sonraí suntasacha:

1. Tá na sonraí ollmhór. Ní bheidh sé oiriúnach ar aon thiomáint crua , bata USB i bhfad níos lú. Tá an méid sonraí níos mó ná an méid is féidir leis an aigne daonna a mheas (smaoineamh ar billiún billiún meigibheart, agus ansin é a mhéadú trí bhiliúin níos mó).

2. Tá na sonraí tearc agus neamhstruchtúrtha. Tá 50% go 80% den obair sonraí mór ag athrú agus ag glanadh an fhaisnéis ionas go mbeidh sé inchuardaithe agus inrite. Níl a fhios ag ach cúpla míle saineolaí ar ár bplainéad conas an glanta sonraí seo a dhéanamh. Tá uirlisí an-speisialaithe ag na saineolaithe seo freisin, cosúil le HPE agus Hadoop, chun a gcuid ceardaíochta a dhéanamh. B'fhéidir go mbeidh 10 mbliana déag ar shaineolaithe móra sonraí, ach is iad seo an speiceas an-annamh a bhfuil anailísí iontu agus tá a gcuid oibre fós an-dÚsachtach agus tedious.

3. Tháinig earraí mar thráchtearraí ** ar féidir iad a dhíol agus a cheannach. Tá margaí sonraí ann nuair is féidir le cuideachtaí agus daoine aonair terabytes na meáin shóisialta agus sonraí eile a cheannach. Tá an chuid is mó de na sonraí bunaithe ar scamall, toisc go bhfuil sé ró-mhór chun freastal ar aon dhiosca crua amháin. Tá táille síntiús ag gabháil le sonraí a cheannach go coitianta nuair a chuireann tú isteach i bhfeirm freastalaí scamall.

** Is iad na ceannairí na n-uirlisí agus na smaointe sonraí móra Amazon, Google, Facebook, agus Yahoo. Ós rud é go dtugann na cuideachtaí seo an oiread sin de na milliúin daoine lena seirbhísí ar líne, bíonn sé ciallmhar gurb iad an pointe bailithe agus na radharcóirí taobh thiar anailísí sonraí mór.

4. Tá féidearthachtaí na sonraí móra gan deireadh. B'fhéidir go dtuigfeadh dochtúirí aon uair amháin go dtiocfaidh croí-ionsaithe agus strokes do dhaoine aonair seachtainí sula dtarlóidh siad. D'fhéadfaí anailís réamhfhabhtaíoch ar a sonraí meicniúla agus ar thrácht agus ar aimsir a laghdú trí thionchar eitleáin agus gluaisteán. D'fhéadfaí feabhas a chur ar dhátú ar líne trí thuaróirí sonraí móra a bhfuil pearsantachtaí comhoiriúnacha agat. B'fhéidir go mbeadh léargas ag ceoltóirí ar an gcomhdhéanamh ceoil is taitneamhach do na blasanna atá ag athrú spriocdhírithe. D'fhéadfadh cothaitheoirí a bheith in ann a thuar cén meascán de bhianna a cheannaítear stórais a dhéanfaidh géarchéimeanna leighis nó duine a chothú. Níor scríobadh an dromchla ach amháin, agus fionnachtana i sonraí móra tarlú gach seachtain.

Big Data Is Messy

Monty Rakusen / Getty

Is anailísí tuarlagacha iad sonraí móra: sonraí ollstruchtúrtha ollmhór a thiontú go rud inchuardaithe agus inrite. Is spás éadrom agus chaotic é seo a éilíonn cineál speisialta eolais agus foighne.

Tóg mar shampla an tseirbhís seachadta UPS monolithic. Déanann na ríomhchláraitheoirí ag UPS sonraí staidéir óna GPS tiománaithe agus ó fhóin chliste chun anailís a dhéanamh ar na bealaí is éifeachtaí chun dul in oiriúint do thráchtáil tráchta. Is gargantuan é seo an GPS agus na sonraí cliste agus níl siad réidh le haghaidh anailíse go huathoibríoch. Bíonn na sonraí seo á gcur i mbun bunachair shonraí GPS agus léarscáil, trí fheistí crua-earraí difriúla fón póca. Chaith anailísithe UPS mí ag athrú na sonraí sin go léir i bhformáid ar féidir iad a chuardach agus a shórtáil go héasca. Is fiú an iarracht sin, áfach. Sa lá atá inniu ann, shábháil UPS níos mó ná 8 milliún galún breosla ó thosaigh siad ag baint úsáide as na hanailísí sonraí mór seo.

Ós rud é go bhfuil sonraí móra sásta agus go gcaithfidh an oiread iarracht a ghlanadh agus a ullmhú lena n-úsáid, tagann eolaithe sonraí ar ainmnigh na ndaoine atá ag glaoch ar na sonraí as an obair tedi a dhéanann siad. Deer

Tá eolaíocht na sonraí mór agus anailísí tuarlagóirí ag feabhsú gach seachtain, áfach. Táthar ag súil go mbeidh teacht ar shonraí móra go héasca do gach duine faoin mbliain 2025.

Nach Bagairt Thráchtach ar Príobháideacht é Big Data?

Feingersh / Getty

Sea, mura ndéantar ár ndlíthe agus ár gcosaintí príobháideachta aonair a bhainistiú go cúramach, ansin cuireann sonraí móra isteach ar phríobháideacht phearsanta. De réir mar a sheasann sé, déanann Google agus YouTube agus Facebook do nósanna laethúla laethúla a rianú cheana féin . Fágann do shaol cliste agus an saol ríomhaireachta lorganna digiteacha gach lá, agus tá cuideachtaí sofaisticiúla ag déanamh staidéir ar na costais sin.

Tá na dlíthe ar fud na sonraí móra ag teacht chun cinn. Is é an príobháideacht ná go gcaithfidh tú freagracht phearsanta a ghlacadh anois, toisc nach féidir leat a bheith ag súil leis mar cheart réamhshocraithe.

Cad is féidir leat a dhéanamh chun do phríobháideacht a chosaint:

Is é an céim aonair is mó is féidir leat a ghlacadh do ghnáthaimh laethúla ag baint úsáide as nasc líonra VPN . Déanfaidh seirbhís VPN do chomhartha a scriosadh ionas go mbeidh do chéannacht agus do shuíomh maisithe go páirteach ó rianaithe. Ní dhéanfaidh sé seo 100% gan ainm agat, ach laghdóidh VPN go mór cé mhéad is féidir leis an domhan do nósanna ar líne a urramú.

Cá háit is féidir liom tuilleadh eolais a fháil faoi shonraí móra?

Monty Raskusen / Getty

Is rud iontach é do shonraí móra do dhaoine a bhfuil intinn anailíseacha agus grá do theicneolaíocht. Más é sin duit, tabhair cuairt cinnte ar an leathanach seo ar thionscadail shonraí móra suimiúla.