Čo je to sklad údajov?
Skladovanie údajov je elektronické ukladanie veľkého množstva informácií firmou alebo organizáciou. Skladovanie údajov je dôležitou súčasťou podnikovej inteligencie, ktorá využíva analytické techniky obchodných údajov.
Koncept skladovania údajov predstavili v roku 1988 vedci IBM Barry Devlin a Paul Murphy. Potreba skladovania údajov sa vyvíjala s tým, ako sa počítačové systémy stávali komplexnejšími a riešili rastúce množstvá údajov. Kľúčovou knihou o skladovaní údajov je WH Inmon's „Building the Warehouse“, ktorá bola prvýkrát publikovaná v roku 1990 a odvtedy bola niekoľkokrát dotlačená.
Ako funguje ukladanie údajov
Skladovanie údajov sa používa na poskytnutie lepšieho prehľadu o výkonnosti spoločnosti porovnaním údajov konsolidovaných z viacerých heterogénnych zdrojov. Dátový sklad je navrhnutý tak, aby spúšťal dotaz a analýzu historických údajov odvodených z transakčných zdrojov.
Po začlenení údajov do skladu sa tieto údaje nezmenia a nemôžu sa zmeniť, pretože dátový sklad vykonáva analýzu udalostí, ktoré sa už vyskytli zameraním sa na zmeny údajov v priebehu času. Skladové údaje musia byť uložené spôsobom, ktorý je bezpečný, spoľahlivý, ľahko získateľný a ľahko spravovateľný.
Existujú určité kroky, ktoré sa podnikli na vytvorenie dátového skladu. Prvým krokom je extrakcia údajov, ktorá zahŕňa zhromažďovanie veľkého množstva údajov z viacerých zdrojových bodov. Po skompilovaní údajov prechádza vyčistením údajov, procesom vyčesávania údajov za chyby a opravou alebo vylúčením akýchkoľvek nájdených chýb.
Vyčistené údaje sa potom skonvertujú z formátu databázy do formátu skladu. Akonáhle je uložený v sklade, údaje prechádzajú triedením, konsolidáciou, sumarizáciou atď., Aby boli koordinovanejšie a ľahšie použiteľné. Postupom času sa do skladu pridáva viac údajov, pretože sa aktualizujú viaceré zdroje údajov.
Kľúčové jedlá
- Skladovanie údajov je elektronické ukladanie veľkého množstva informácií firmou alebo organizáciou. Dátový sklad je určený na spúšťanie dotazov a analýz historických údajov odvodených z transakčných zdrojov na účely podnikovej inteligencie a získavania údajov. Skladovanie údajov sa používa na zabezpečenie väčšieho množstva údajov. vhľad do výkonnosti spoločnosti porovnaním údajov konsolidovaných z viacerých heterogénnych zdrojov.
Osobitné úvahy: Dolovanie údajov
Podniky môžu skladovať údaje na použitie pri prieskume a ťažbe údajov a hľadajú vzory informácií, ktoré im pomôžu zlepšiť ich obchodné procesy. Dobrý systém skladovania údajov môže rôznym oddeleniam spoločnosti uľahčiť vzájomný prístup k údajom.
Napríklad dátový sklad môže spoločnosti umožniť ľahké vyhodnotenie údajov obchodného tímu a pomôcť pri rozhodovaní o tom, ako zlepšiť predaj alebo zefektívniť oddelenie. Podnik by sa mohol rozhodnúť zamerať na výdavkové zvyky svojich zákazníkov, aby lepšie umiestnil svoje výrobky a zvýšil predaj.
Vďaka skladovaniu údajov môže spoločnosť zhromažďovať historické údaje o výdavkoch svojich zákazníkov v minulosti - povedzme 20 rokov - a analyzovať tieto údaje. Výsledné informácie by mohli poskytnúť pohľad na preferencie jeho spotrebiteľov; čas dňa, mesiaca alebo roka s vyšším predajom; alebo zákazník s najvyššou spotrebou za daný rok.
Efektívne ukladanie a správa údajov sú tiež to, čo umožňuje procesy, ako napríklad iniciovanie cestovných rezervácií a používanie bankomatov.
Proces získavania údajov je rozdelený do piatich krokov:
- Organizácie zhromažďujú údaje a načítajú ich do svojich dátových skladov. Potom ich ukladajú a spravujú, buď na interných serveroch alebo v cloude. K údajom majú prístup analytici obchodu, riadiace tímy a odborníci v oblasti informačných technológií a určujú, ako ich chcú usporiadať. Aplikačný softvér potom triedi údaje na základe používateľových výsledkov. Koncový používateľ konečne prezentuje údaje v ľahko zdieľateľnom formáte, ako je napríklad graf alebo tabuľka.
Skladovanie dát verzus databázy
Dátový sklad nemusí byť nevyhnutne rovnaký koncept ako štandardná databáza. Databáza je transakčný systém, ktorý je nastavený na monitorovanie a aktualizáciu údajov v reálnom čase, aby boli k dispozícii iba najnovšie údaje. Dátový sklad je naprogramovaný na agregáciu štruktúrovaných údajov za určité časové obdobie. Napríklad databáza môže mať iba najnovšiu adresu zákazníka, zatiaľ čo dátový sklad môže mať všetky adresy, v ktorých zákazník žil posledných 10 rokov.
![Definícia skladovania údajov Definícia skladovania údajov](https://img.icotokenfund.com/img/financial-technology/385/data-warehousing.jpg)