Date întunecate

Datele întunecate  sunt date care sunt colectate automat în timpul activităților de rutină din rețelele de calculatoare, dar nu sunt utilizate în niciun fel pentru a obține informații sau a lua decizii [1] [2] . Capacitatea unei organizații de a colecta date poate depăși debitul cu care poate analiza datele . În unele cazuri, organizația poate să nu fie conștientă de faptul că sunt colectate date [3] . IBM estimează că aproximativ 90% din datele generate de senzori și convertoare A/D nu sunt niciodată utilizate [4] .

Într-un context industrial, datele întunecate pot include informații colectate de senzori și telematică [5] .

Organizațiile stochează date ascunse dintr-o varietate de motive și se estimează că majoritatea companiilor analizează doar 1% din datele lor [6] . Motivele pentru stocarea datelor neutilizate pot include conformitatea cu reglementările [7] și arhivele [1] . Unele organizații consideră că datele ascunse le pot fi utile în viitor, când vor fi disponibile tehnologii de analiză și business intelligence mai avansate [3] . Deoarece stocarea este ieftină, stocarea datelor este ușoară. Cu toate acestea, stocarea și protecția datelor implică de obicei costuri mai mari decât profitul potențial.

Profesorul David Hand de la Imperial College London folosește termenul „date întunecate” pentru a se referi la datele lipsă: „datele întunecate sunt date pe care nu le aveți” [8] [a] .

Analiză

O mulțime de date întunecate sunt nestructurate, ceea ce înseamnă că informațiile sunt prezentate în formate care pot fi greu de clasificat, citit de un computer și astfel analizat. Adesea, motivul pentru care o afacere nu își analizează datele întunecate este cantitatea de resurse de care va avea nevoie și dificultatea de a analiza acele date. Potrivit Computer Weekly , 60% dintre organizații spun că propriile capacități BI sunt „inadecvate” și 65% spun că au „abordări oarecum dezorganizate ale managementului conținutului” 10] .

Relevanță

Datele utile care și-au pierdut relevanța în timp pot intra și ele în categoria datelor întunecate. Acest lucru se datorează vitezei insuficiente de procesare a datelor. De exemplu, dacă geolocalizarea unui client este cunoscută de business, compania poate face o ofertă bazată pe locație, totuși, dacă aceste date nu sunt procesate imediat, este posibil să nu fie relevante în viitor. Potrivit IBM, aproximativ 60 la sută din datele colectate își pierd imediat valoarea [4] .

Depozitare

Potrivit New York Times , 90% din energia folosită de centrele de date este risipită [11] . Evitarea stocării redundante de date ar economisi costurile energetice. În plus, există costuri asociate cu subutilizarea informațiilor și, ca urmare, oportunități pierdute. Potrivit Datamation, „datele stocate în organizațiile membre EMEA sunt 54% date întunecate, 32% date redundante, învechite și triviale și doar 14% din orice valoare. Începând cu 2020, stocarea datelor redundante costă aproximativ 900 de miliarde de dolari SUA [12]. ] .

Stocarea permanentă a datelor întunecate poate pune o organizație în pericol, mai ales dacă datele sunt sensibile. Scurgerea de date poate duce la consecințe grave: financiare, juridice și reputaționale. De exemplu, scurgerea datelor personale ale clienților poate duce la furtul masiv de identitate . Un alt exemplu ar fi scurgerea de informații sensibile ale unei companii, cum ar fi cele legate de cercetare și dezvoltare . Aceste riscuri pot fi atenuate prin evaluarea și verificarea nevoii de date pentru organizație și prin utilizarea unei criptări puternice și a altor măsuri de securitate [13] . Ștergerea datelor inutile ar trebui făcută în așa fel încât să nu poată fi restaurate [14] .

Viitorul

Este în general acceptat că, pe măsură ce sunt create sisteme de calcul mai avansate, valoarea datelor întunecate va crește. Există opinia că datele și analiza lor vor deveni baza unei noi revoluții industriale [5] . Datele potențial utile includ și ceea ce este considerat în prezent „date întunecate”, deoarece nu există suficiente resurse pentru a le procesa. Toate aceste date pot fi folosite în viitor pentru a asigura performanța maximă și capacitatea organizațiilor de a răspunde nevoilor clienților. Organizațiile de sănătate și educație care se ocupă de cantități mari de date pot beneficia în special de prelucrarea datelor neutilizate în viitor [15] .

Note

Note de subsol

  1. Hands enumeră 15 tipuri diferite de date întunecate, în funcție de natura acestora din urmă [9]

Surse

  1. ↑ 12 Date întunecate . Gartner . Preluat la 27 aprilie 2021. Arhivat din original la 31 martie 2019.
  2. Titlu. Pericolele datelor întunecate și cum să vă minimizați expunerea . CIO (24 septembrie 2014). Preluat la 27 aprilie 2021. Arhivat din original la 15 ianuarie 2019.
  3. ↑ 12 Brantley . Briefingul API: provocarea datelor întunecate ale guvernului . Digitalgov.gov (17 iunie 2015). Preluat la 27 aprilie 2021. Arhivat din original la 16 ianuarie 2018.
  4. 12 Johnson .  Dezgroparea datelor întunecate: ce pune IBM în fruntea economiei de perspectivă ? . SiliconANGLE (30 octombrie 2015). Consultat la 3 noiembrie 2015. Arhivat din original la 11 iulie 2018.  
  5. ↑ 12 Deni . TeradataVoice: Fabricile viitorului: valoarea datelor întunecate . Forbes (19 februarie 2015). Arhivat din original pe 22 februarie 2015.
  6. Shahzad. Provocarea big data a transformării pentru industria de producție . IBM Big Data & Analytics Hub (3 ianuarie 2017). Preluat la 27 aprilie 2021. Arhivat din original la 6 martie 2018.
  7. Îți folosești în mod eficient datele întunecate (downlink) . Preluat la 27 aprilie 2021. Arhivat din original la 16 ianuarie 2017. 
  8. David Hand. Discuții de 10 minute: date întunecate . Academia Britanică . Academia Britanică (18 noiembrie 2020). Preluat la 2 martie 2021. Arhivat din original la 27 aprilie 2021.
  9. Hand, 2021 , p. 17.
  10. Miles. Datele întunecate ar putea opri calea către succes a datelor mari . Computer Weekly (27 decembrie 2013). Consultat la 3 noiembrie 2015. Arhivat din original la 10 aprilie 2019.
  11. Glanz . Centrele de date risipesc cantități uriașe de energie, dezmințind imaginea industriei , The New York Times  (22 septembrie 2012). Arhivat 16 mai 2019. Recuperat la 2 noiembrie 2015.
  12. Hernandez. Întreprinderile acumulează date „întunecate”: Veritas . Datamation (30 octombrie 2015). Consultat la 4 noiembrie 2015. Arhivat din original la 4 octombrie 2017.
  13. DarkShield folosește Machine Learning pentru a găsi și masca PII , IRI. Arhivat din original pe 15 ianuarie 2019. Preluat la 14 ianuarie 2019.
  14. Titlu. Pericolele datelor întunecate și cum să vă minimizați expunerea . CIO (24 septembrie 2014). Consultat la 2 noiembrie 2015. Arhivat din original la 15 ianuarie 2019.
  15. Prag.  Utilizarea datelor întunecate : întrebări și răspunsuri cu Melissa McCormack  ? . The Machine Learning Times (30 septembrie 2014). Consultat la 4 noiembrie 2015. Arhivat din original la 14 aprilie 2019.

Literatură