Andmehaldus
Andmehaldus (ing k Data Management) on praktika, mis hõlmab andmete kogumist, töötlemist ja kasutamist turvaliselt ja tõhusalt, et saavutada paremaid tulemusi nii ärilisises kontekstis kui ka üksikisiku tasandil.[1] See tähendab, et andmeid hallatakse viisil, mis tagab nende täpsuse, kättesaadavuse ja turvalisuse, võimaldades nii ettevõtetel kui ka üksikisikutel teha teadlikke otsuseid ja optimeerida oma tegevusi.[2]
Andmehalduse peamine eesmärk on tagada andmete tõhus kasutamine ja kaitse. Andmete kasutamine on oluline, sest võimaldab nende haldamist. Samuti on tähtis kontrollida andmete taaskasutamist, et veenduda nende turvalisuses ja kaitstuses.[3] Üksikisiku tasandil tähendab see näiteks isiklike failide ja dokumentide turvalist salvestamist, varundamist ja vajadusel kustutamist, et kaitsta privaatsust ja vältida andmete kadumist või väärkasutust.
Ajalugu
[muuda | muuda lähteteksti]1950. aastatel muutus andmete haldamine oluliseks probleemiks, kuna tollased arvutid olid aeglased ja kohmakad ning nõudsid palju käsitsitööd. Ettevõtted kasutasid terveid ruume perfokaartide hoidmiseks ja haldamiseks ning teisi ruume sorteerijate, tabelarvutite ja perfokaardimasinate hooldamiseks.[4]
Arvutite arenedes arenesid ka andmehalduse meetodid, mis viisid 1950. aastate lõpus teise põlvkonna programmeerimiskeelte väljatöötamiseni, mis omakorda muutis programmeerimise lihtsamaks.[4]
Andmehaldus kui kontseptsioon sai alguse 1960. aastatel, kui ADAPSO (Association of Data Processing Service Organizations) hakkas edendama andmehalduse soovitusi, keskendudes professionaalsele koolitusele ja kvaliteedi tagamise meetmetele.[4] Kõrgetasemeliste keelte (High-Level languages) kasutuselevõtt lihtsustas veelgi programmeerimist, võimaldades paremat andmete korraldamist ja haldamist.[4]
1970. aastatel revolutsioneeris struktureeritud küsitluskeel (SQL) relatsiooniliste andmebaaside haldamist, võimaldades tõhusat andmete töötlemist ja vähendades andmete dubleerimist.[4]
2000. aastatel tõusis esikohale pilvandmetöötlus, mis muutis andmehalduse konseptsiooni, pakkudes suurendatavaid salvestuslahendusi ja vähendades sisemisi hoolduskulusid.
Andmehalduse tähtsus kasvas peale Isikuandmete kaitse üldmääruse (GDPR) rakendamist 2016. aastal, rõhutades kvaliteetse andmejuurdepääsu ja vastavuse vajadust. Arenesid andmejärved ja andmevõrgud (data fabrics), mis on loodud struktureerimata andmete haldamiseks, et rahuldada arenenud analüütika ja masinõppe rakenduste nõudmisi.[4]
Andmehaldus on alates 21. sajandist pidevalt arenenud, hõlmates laia valikut tehnoloogiaid ja tööriistu. Selle hulka kuulub ka andmebaaside haldustarkvara, mis on osa andmehaldussüsteemist. Andmebaaside haldussüsteem on kõige tavalisem andmehaldusplatvormide vorm ja toimib liidesena andmebaasi ja lõppkasutaja vahel.[4]
Andmehalduse põhimõtted
[muuda | muuda lähteteksti]Eesmärgid
[muuda | muuda lähteteksti]- Andmehaldus on oluline valdkond, mis toetab põhiprotsesse ja juhtimist, toimides tugifunktsioonina. See on tihedalt seotud nii infohalduse kui ka infotehnoloogiaga, tagades andmete tõhusa kasutamise ja kaitse.[5]
- Andmehalduse peamine ülesanne on tagada, et asutuse valduses olevad andmed oleksid hästi hallatud ja kaitstud. See hõlmab andmete ülevaate loomist, läbipaistva kasutamise tagamist ning selgituste andmise võimalust. Samuti on oluline kaitsta andmeid volitamata töötlemise eest ja arvestada isikuandmete kaitse nõuetega.[5]
- Andmehalduse põhieesmärk on hõlbustada ja kiirendada andmetega töötamist, tagades nende leitavuse, usaldusväärsuse ja kasutatavuse. See muudab andmed väärtuslikuks varaks, võimaldades asutustel täita oma ülesandeid tõhusamalt.[5]
- Andmete teisese kasutamise võimaldamine nõuab ülevaatlikku asutustevahelist andmevahetust, et tagada turvalisus ja üksikisiku õiguste kaitse.[5]
Tegevused
[muuda | muuda lähteteksti]- Organisatsioonis peab olema selgelt määratletud andmehalduse eest vastutamise kord. Vastutuse jagamine sõltub asutuse suurusest ja keerukusest ning võib varieeruda sõltuvalt organisatsiooni struktuurist, hõlmates rolle alates juhtkonnast kuni iga töötajani.[5]
- Andmehaldus ei toimi isoleeritult, vaid on tihedalt seotud IT ja teabehaldusega. Teabehalduse korraldamisel peavad asutused arvestama andmehalduse põhimõtetega ning mõistma nende erinevusi üldisest teabehaldusest.[5]
Andmehalduse põhimõisted
[muuda | muuda lähteteksti]Andmete kogumine ja säilitamine
[muuda | muuda lähteteksti]- Andmed (Data): faktide, numbrite, sõnade, tähelepanekute või muu kasuliku teabe kogum. Andmete töötlemise ja analüüsi kaudu muudavad organisatsioonid toorandmed väärtuslikeks teadmisteks, mis parandavad otsuste tegemist ja viivad paremate äriliste tulemusteni.[6]
- Andmete hankimine (Data acquisition): andmete kogumine erinevatest sisemistest ja välistest allikatest, rõhuasetusega andmete täpsusele ja asjakohasusele.[7]
- Andmete säilitamine (Data storage): andmete säilitamine andmebaasides, andmeladudes, pilvesalvestuses, andmejärvedes või nende kombinatsioonis.[7]
- Andmeladu (Data warehouse): andmehaldussüsteem, mida kasutatakse peamiselt äriteabe ja analüüsi jaoks. Andmelaod salvestavad suures koguses ajaloolisi andmeid erinevatest allikatest ja teevad need päringuteks ja analüüsiks kättesaadavaks.[8]
- Pilvtalletus (Cloud storage): pilvesalvestus on kaugplatvorm, mis kasutab kõrgelt virtuaalset, mitme rentnikuga infrastruktuuri, et pakkuda ulatuslikke salvestusressursse.[9]
- Andmekogu (Data sets): korrastatud andmete kogum, mille pidamisel kasutatakse automatiseeritud andmetöötlust või mida peetakse käsitsi ja korrastatud vormidel, mis võimaldavad andmetega lihtsat tutvumist või nende mehhaanilist töötlemist.[10]
- Andmete töötlemine
- Andmeanalüüs (Data analysis): andmete kasutamine, et saada teadmisi, teha teadlikke otsuseid ning tuvastada arengusuundi ja mustreid.[11]
- Andmetehnika (Data engineering): suuremahuliste andmemassiivide kogumiseks, säilitamiseks ja analüüsiks mõeldud süsteemide projekteerimine ja ehitamine.[12]
- Andmeobjekt (Data object): andmestruktuuri, näiteks faili, massiivi või toimetaja element, mida on vaja programmide täitmiseks.[13]
Andmete haldamine
[muuda | muuda lähteteksti]- Andmete haldamine (Data governance): põhimõtete, suuniste ja vastutuse kehtestamine, et hallata andmeid kogu nende elutsükli jooksul.[7]
- Andmete elutsükli haldamine (Data lifecycle management): andmete nõuetekohane haldamine alates andmete loomisest kuni nende hävitamiseni, tagades kõigis etappides vastavuse õiguslikele ja regulatiivsetele nõuetele.[7]
- Andmete kvaliteet (Data quality): andmete täpsuse ja järjepidevuse tagamine, tuvastades ja parandades vead.[7]
- Andmekaitse (Data privacy): turvameetmete ja juurdepääsukontrolli rakendamine, et kaitsta andmeid volitamata juurdepääsu, rikkumiste eest.[7]
- Metaandmete haldamine (Metadata management): põhjaliku dokumentatsiooni ja metaandmete säilitamine, et tagada andmete kontekst ja arusaadavus.[7]
Andmete integreerimine ja kasutamine
[muuda | muuda lähteteksti]- Andmete integreerimine (Data Integrations): erinevatest allikatest pärit andmete kombineerimine, et anda ühtne ülevaade ning toetada analüüsi ja aruandlust.[7]
- Avaandmed (Open Data): krüpteerimata andmed, kõigile vabalt ja avalikult kasutamiseks antud masinloetaval kujul andmed, millel puuduvad kasutamist ning levitamist takistavad piirangud.[14][15]
- Metaandmed (Metadata): andmed, mis kirjeldavad teisi andmeid.[16]
Spetsiifilised terminid
[muuda | muuda lähteteksti]- Andmeelement (Data element): andmeüksus, mis teatud kontekstis loetakse jagamatuks.[17]
- Andmehaldur (Data manager/ Data steward): vastutab selle eest, et andmetega seotud töö toimuks vastavalt andmehalduse kaudu kehtestatud poliitikatele ja tavadele. Andmehaldur on Isik või organisatsioon, kellele on antud vastutus konkreetse andmekogumi haldamise eest.[18]
- Andmebaas (Database): omavahel seotud ja süstematiseeritud andmete kogum mis lisaks andmetele sisaldab eneses ka nende andmete struktuuri kirjeldust.[19]
- Dokumendihaldus (Document management): dokumentide haldamine asutuses või ettevõttes: nende loomine, registreerimine, süstematiseerimine, hoidmine, kasutamine ja edastamine.[20]
Andmehalduse liigid
[muuda | muuda lähteteksti]- Andmekonveier on tee, mille kaudu ettevõtted saavad automaatselt teavet edastada kahe või enama erineva süsteemi vahel.[21] Näiteks kasutavad E-kaubanduse ettevõtted andmekonveiereid, et automaatselt edastada tellimuste ja laoseisu andmeid oma veebipoe ja lao vahel. See tagab, et laoseisud on alati ajakohased ja kliendid saavad täpset teavet toodete saadavuse kohta.
- ETL (extract, transform, load) on andmetorustiku tüüp, mis ekstraktib andmeid andmebaasist, vormindab neid ja laadib uude asukohta salvestamiseks. ETL-i eeliseks on see, et see suudab koguda andmeid mitmest allikast ja salvestada need ühte lahendusse.[22] Näiteks kasutavad finantsasutused ETL-protsesse, et koguda andmeid erinevatest allikatest, näiteks pangakontodest ja krediitkaarditehingutest, ning laadida need andmelaosse, kus neid saab analüüsida ja aruandluseks kasutada.
- Andmearhitektuur on formaalne protsess, mis aitab hallata andmevoogu kindla andmestruktuuri kaudu. Andmearhitektuuri abil luuakse teabevood kogu süsteemis.[23] Näiteks loovad suured tehnoloogiaettevõtted, nagu Google ja Amazon keerukaid andmearhitektuure, et hallata tohutuid andmevooge oma teenuste vahel.
- Andmemodelleerimine on visuaalsed diagrammid, mis näitavad, kuidas andmed süsteemis liiguvad. Need aitavad meeskonnal mõista andmevoogu süsteemi sees või erinevate süsteemide vahel. Ettevõtted loovad sageli mitu andmemudelit oma erinevate süsteemide jaoks.[24] Näiteks loovad tervishoiuasutused andmemudeleid, et jälgida patsientide terviseandmeid ja ravi ajalugu.
- Andmekataloogiks nimetatakase üksikasjalikku loetelu kõigist organisatsiooni andmevaradest, mis on loodud selleks, et andmespetsialistid saaksid kiiresti leida kõige sobivamad andmed mis tahes analüütiliseks või äriliseks otstarbeks.[25] Näiteks kasutavad suured ettevõtted, nagu Microsoft ja IBM andmekatalooge, et hallata ja leida kiiresti vajalikud andmed erinevate projektide ja analüüside jaoks.
- Andmetkaitse eesmärk on kaitsta organisatsiooni teavet rikkumiste, varguste ja volitamata juurdepääsu eest. Tavaliselt on see IT-funktsioon, mis loob poliitikad tarkvara, juurdepääsu, varukoopiate, salvestamise ja muu jaoks.[26] Näiteks rakendavad pangad ja finantsasutused rangeid andmekaitsemeetmeid, et kaitsta klientide tundlikku teavet volitamata juurdepääsu ja küberrünnakute eest. See hõlmab krüpteerimist, juurdepääsukontrolli ja regulaarseid turvaauditeid.
Muud andmehalduse liigid
[muuda | muuda lähteteksti]- Andmete elutsükli haldamine on ähenemisviis andmete haldamisele kogu nende elutsükli jooksul, alates andmete loomisest kuni andmete hävitamiseni.[27]
- Andmete integreerimine hõlmab mitmest allikast pärit andmete ühendamist ja ühtlustamist ühtsesse, sidusasse vormingusse. Seda tehakse selleks, et andmeid saaks tõhusalt kasutada erinevatel analüütilistel, operatiivsetel ja otsuste tegemise eesmärkidel.[28]
- Andmete migreerimine on protsess, mis hõlmab andmete valimist, ettevalmistamist, ekstraheerimist ja teisendamist ning nende püsivat ülekandmist ühest arvuti salvestussüsteemist teise.[29]
- Andmesalvestus viitab magnetilistele, optilistele või mehaanilistele andmekandjatele, mis salvestavad ja säilitavad digitaalset teavet käimasolevate või tulevaste toimingute jaoks.[30]
Andmehalduse tööriistad
[muuda | muuda lähteteksti]Pilvandmetöötlusvahendid aitavad organisatsioonidel integreerida ja hallata andmeid mitmes pilvekeskkonnas, võimaldades suure andmemahuga ettevõtetel salvestada, sorteerida, analüüsida ja rutiinselt hallata oma andmeid tervikuna pilveteenuses. Näiteks: Panoply, Amazon Web Services, Microsoft Azure ja Google Cloud.
ETL-tööriistad erinevad suuresti selles, kuidas andmetega töötadakse. Mõned tööriistad pakuvad visuaalseid liideseid, teised pakuvad point-and-click integratsiooni, lisaks nõuavad mõned ETL-tööriistad põhjalikumat kodeerimisoskust. Näiteks Informatica PowerCenter, Stitch Data, Fivetran, Blendo ja Alooma.[31]
Automatiseerimine võimaldab ettevõtetel muuta andmete vorminguid, mis on oluline samm andmete integreerimise protsessis. See hõlmab nii struktureeritud kui ka struktureerimata andmete migreerimist ja muutmist automaatselt erinevatest allikatest mõne minutiga. Näiteks Dataform, Airflow ja Luigi.[31]
Põhiandmete haldamise tööriistad on loodud ettevõtte kesksete ja põhiliste andmete haldamiseks, nagu kliendi-, töötaja-, tegevus- ja regulatiivsed andmed. Need tööriistad aitavad andmete puhastamisel, tsentraliseerimisel, tehingute kontrollimisel, võtmete kaardistamisel ja mitme domeeni toetamisel. Lisaks hõlbustavad põhiandmete haldamise tööriistad teabe jagamist ja globaalset sünkroniseerimist erinevatest asukohtadest. Näiteks Dell Boomi, Profisee ja SAP NetWeaver.[31]
Võrdlusandmete haldus on põhiandmete halduse osa, mida kasutatakse klassifitseerimiseks ja lubatud väärtuste määratlemiseks, mida teised valdkonnad nii sise- kui ka väliskeskkonnas kasutavad. Näiteks võivad need andmed hõlmata sihtnumbreid, riigikoode, mõõtühikuid, valuutasid, tooteid ja hindu. Tugevate tööriistade kasutamine võrdlusandmete haldamiseks on oluline, kuna need andmed toimivad paljude süsteemide jaoks viitepunktina. Kehv võrdlusandmete haldus võib põhjustada operatiivseid ebatõhususi, halba juhtimist ning ebaõigeid aruandeid ja analüüse.[31]
Andmehalduse raskused ja tulevikusuunad
[muuda | muuda lähteteksti]Andmete haldamise väljakutsed on mitmekesised ja keerulised. Organisatsioonid koguvad ja salvestavad andmeid üha suuremast hulgast ja mitmekesistest allikatest, sealhulgas sensoritest, nutiseadmetest, sotsiaalmeediast ja videokaameratest. Kuid need andmed ei ole kasulikud, kui organisatsioon ei tea, milliseid andmeid ta omab, kus need asuvad ja kuidas neid kasutada. Andmehalduslahendused vajavad õigeaegselt olulist teavet, et pakkuda õigeid ja olulisi teadmisi.[32]
Organisatsioonid seisavad silmitsi raskustega andmete haldamise tulemuslikkuse taseme säilitamisel. Andmemaht kasvab pidevalt ja selleks, et säilitada tipptasemel vastamisaeg peavad organisatsioonid pidevalt jälgima, millist tüüpi päringutele andmebaas vastab ja muutma andmebaasi indekseid vastavalt päringute muutumisele, ilma et see mõjutaks jõudlust.[32]
Nõuetele vastavuse eeskirjad on keerulised ja mitut pädevust hõlmavad ning need muutuvad pidevalt. Organisatsioonid peavad olema võimelised oma andmeid hõlpsasti üle vaatama ja tuvastama kõik, mis kuulub uute või muudetud nõuete alla. Eelkõige tuleb tuvastada ja jälgida isikuandmeid, et need vastaksid üha rangematele ülemaailmsetele eraelu puutumatust käsitlevatele regulatsioonidele.[32]
Andmete kogumine ja tuvastamine ei too väärtust, kui organisatsioon ei töötle neid andmeid. Kui andmeteanalüüsiks vajalik teisendamiseks kulub liiga palju aega, siis jääb analüüs tegemata. Selle tulemusena läheb nende andmete potentsiaalne väärtus kaotsi.[32] Andmeid hoitakse erinevates süsteemides, sealhulgas andmeladudes ja struktureerimata andmeparkides. Organisatsiooni andmetöötlejatel on vajavalik võimalusel kiiresti ja lihtsalt muuta andmed algsest vormingust sobivasse vormi, formaati või mudelisse, et neid saaks kasutada erinevates analüüsides.[32]
Alates 2000. aastatest, mil pilveandmehaldussüsteemid muutusid kergesti kättesaadavaks, saavad organisatsioonid valida, kas hoida ja analüüsida andmeid kohapealses keskkonnas, pilves või nende kahe kombinatsioonis. IT-organisatsioonid peavad hindama kohapealsete ja pilvekeskkondade identsuse taset, et säilitada maksimaalne IT-alane tegevus ja vähendada kulusid.[32]
Vaata ka
[muuda | muuda lähteteksti]- Andmekaeve
- Andmeturve
- Andmete varundamine
- Andmekaitse
- Andmepüük
- Andmekaitse
- Andmekaitse Inspektsioon
- Teabehaldus
- Infokorraldus
- Infoarhitektuur
- Informatsioonidisain
- Andmehaldusplaan
- Mälu (arvuti)
- Digitaalarhiivindus
- Dokumendihaldus
- Identiteedivargus
- Isikuandmete kaitse üldmäärus
Kasutatud kirjandus
[muuda | muuda lähteteksti]- ↑ "Data management", Wikipedia (inglise), 13. november 2024, vaadatud 14. novembril 2024
- ↑ "What Is Data Management? | IBM". www.ibm.com (inglise). 3. juuli 2024. Vaadatud 14. novembril 2024.
- ↑ "Andmehaldus | Statistikaamet". www.stat.ee. Vaadatud 14. novembril 2024.
- ↑ 4,0 4,1 4,2 4,3 4,4 4,5 4,6 Foote, Keith D. (19. veebruar 2022). "A Brief History of Data Management". DATAVERSITY (Ameerika inglise). Vaadatud 14. novembril 2024.
- ↑ 5,0 5,1 5,2 5,3 5,4 5,5 "Andmehalduse põhimõtted | Statistikaamet". stat.ee. Vaadatud 14. novembril 2024.
- ↑ "What is Data? | IBM". www.ibm.com (inglise). 3. oktoober 2024. Vaadatud 14. novembril 2024.
- ↑ 7,0 7,1 7,2 7,3 7,4 7,5 7,6 7,7 Yen, Leon (15. september 2023). "What Is Data Management? Examples, Strategies & Challenges". Enterprise Storage Forum (Ameerika inglise). Vaadatud 14. novembril 2024.
- ↑ "What is a Data Warehouse? | IBM". www.ibm.com (inglise). 11. oktoober 2024. Vaadatud 14. novembril 2024.
- ↑ "cloud storage - AKIT". akit.cyber.ee. Vaadatud 14. novembril 2024.
- ↑ "Andmekogude seadus–Riigi Teataja". www.riigiteataja.ee. Vaadatud 14. novembril 2024.
- ↑ "Data analysis", Wikipedia (inglise), 4. november 2024, vaadatud 14. novembril 2024
- ↑ "Data engineering", Wikipedia (inglise), 31. august 2024, vaadatud 14. novembril 2024
- ↑ "data object - AKIT". akit.cyber.ee. Vaadatud 14. novembril 2024.
- ↑ "Avaandmed", Vikipeedia, 11. november 2024, vaadatud 14. novembril 2024
- ↑ "unencrypted data - AKIT". akit.cyber.ee. Vaadatud 14. novembril 2024.
- ↑ "metadata - AKIT". akit.cyber.ee. Vaadatud 14. novembril 2024.
- ↑ "Data element", Wikipedia (inglise), 4. september 2024, vaadatud 14. novembril 2024
- ↑ "Data steward", Wikipedia (inglise), 21. august 2024, vaadatud 14. novembril 2024
- ↑ "2.1.1 Andmed ja informatsioon". eopearhiiv.edu.ee. Vaadatud 14. novembril 2024.
- ↑ "What Is Document Management? | IBM". www.ibm.com (inglise). 9. juuni 2021. Vaadatud 14. novembril 2024.
- ↑ "data pipeline - AKIT". akit.cyber.ee. Vaadatud 14. novembril 2024.
- ↑ "Extract, transform, load", Wikipedia (inglise), 5. november 2024, vaadatud 14. novembril 2024
- ↑ "Data architecture", Wikipedia (inglise), 12. detsember 2022, vaadatud 14. novembril 2024
- ↑ "data modeling - AKIT". akit.cyber.ee. Vaadatud 14. novembril 2024.
- ↑ "What Is a Data Catalog? | IBM". www.ibm.com (inglise). 28. september 2021. Vaadatud 14. novembril 2024.
- ↑ "Data security", Wikipedia (inglise), 18. september 2024, vaadatud 14. novembril 2024
- ↑ "Data lifecycle management | IBM". www.ibm.com (inglise). 12. november 2021. Vaadatud 14. novembril 2024.
- ↑ "What Is Data Integration? | IBM". www.ibm.com (inglise). 18. september 2023. Vaadatud 14. novembril 2024.
- ↑ "What is Data Migration? | Microsoft Azure". azure.microsoft.com (Ameerika inglise). Vaadatud 14. novembril 2024.
- ↑ "What Is Data Storage? | IBM". www.ibm.com (inglise). 8. juuni 2021. Vaadatud 14. novembril 2024.
- ↑ 31,0 31,1 31,2 31,3 "The 34 Best Data Management Tools, Systems and Solutions (2024 updated)". blog.panoply.io (Ameerika inglise). Vaadatud 14. novembril 2024.
- ↑ 32,0 32,1 32,2 32,3 32,4 32,5 https://www.oracle.com/au/database/what-is-data-management/