ecosmak.ru

Klasifikácia databázy podľa spôsobu organizácie údajov. Klasifikácia a charakteristika databáz

2.1. Definície a pojmy teórie databáz

Databáza (DB, database) je pomenovaná zbierka štruktúrovaných údajov týkajúcich sa konkrétnej oblasti.

Predmetová oblasť je nejaká časť reálneho systému, ktorý funguje ako nezávislá jednotka.

Úplná tematická oblasť môže predstavovať hospodárstvo krajiny alebo skupiny spojeneckých štátov, ale v praxi pre informačné systémy najvyššia hodnota má predmetnú oblasť rozsahu jednotlivého podniku alebo korporácie.

Databázový manažérsky systém (DBMS) je súbor softvérových a jazykových nástrojov potrebných na vytváranie a úpravu databázy, pridávanie, úpravu, mazanie, vyhľadávanie a výber informácií, prezentáciu informácií na obrazovke a v tlačenej forme, vymedzovanie prístupových práv k informáciám, a vykonávanie iných základných operácií.

Relačná databáza je hlavným typom moderných databáz. Pozostáva z tabuliek, medzi ktorými môžu existovať vzťahy podľa kľúčových hodnôt.

Databázová tabuľka (tabuľka) je pravidelná štruktúra, ktorá pozostáva z riadkov rovnakého typu (záznamov) rozdelených do stĺpcov (polí).

V teórii relačných databáz je tabuľka synonymom vzťahu, v ktorom sa riadok nazýva n-tica a stĺpec sa nazýva atribút.

V koncepčnom modeli relačnej databázy je analógom tabuľky entita (entita) s určitým súborom vlastností - atribútov, ktoré môžu nadobúdať určité hodnoty (súbor platných hodnôt - doména).

Kľúčovým prvkom tabuľky (kľúč, bežný kľúč) je jej pole (jednoduchý kľúč) alebo reťazcový výraz vytvorený z hodnôt niekoľkých polí (zložený kľúč), pomocou ktorého môžete určiť hodnoty iných polí pre jeden alebo viac záznamov tabuľky. V praxi sa na použitie kľúčov vytvárajú indexy - servisné informácie obsahujúce objednané informácie o hodnotách kľúča. V relačnej teórii a konceptuálnom modeli sa pojem „kľúč“ aplikuje na atribúty vzťahu alebo entity.

Primárny kľúč je hlavný kľúčový prvok, ktorý jednoznačne identifikuje riadok v tabuľke. Môžu existovať aj alternatívne (kľúč kandidáta) a jedinečné (jedinečný kľúč) kľúče, ktoré tiež slúžia na identifikáciu riadkov v tabuľke.

V relačnej teórii je primárny kľúč minimálny súbor atribútov, ktoré jednoznačne identifikujú n-ticu vo vzťahu.

V koncepčnom modeli je primárny kľúč minimálna množina atribútov entity, ktorá jednoznačne identifikuje inštanciu entity.

Komunikácia (vzťah) — funkčná závislosť medzi objektmi. V relačných databázach sa vzťahy medzi tabuľkami vytvárajú kľúčmi, z ktorých jeden v hlavnej (nadradenej, rodičovskej) tabuľke je primárny, druhý je cudzí kľúč - v externej (dieťa, potomok) tabuľke spravidla nie je primárny a tvorí vzťah „jeden k mnohým“ (1:N). V prípade primárneho cudzieho kľúča je vzťah medzi tabuľkami jedna k jednej (1:1). Informácie o odkazoch sú uložené v databáze.

Cudzí kľúč (cudzí kľúč) - kľúčový prvok podriadenej (externej, dcérskej) tabuľky, ktorého hodnota sa zhoduje s hodnotou primárneho kľúča hlavnej (nadradenej) tabuľky.

Referenčná integrita je súbor pravidiel, ktoré zodpovedajú kľúčovým hodnotám v súvisiacich tabuľkách.

Uložené procedúry sú programové moduly, ktoré sú uložené v databáze na vykonávanie určitých operácií s databázovými informáciami.

Spúšťače sú uložené procedúry, ktoré zaisťujú splnenie podmienok referenčnej integrity údajov pri operáciách zmeny primárnych kľúčov (prípadne kaskádových údajov), odstraňovania záznamov v hlavnej tabuľke (kaskádové odstraňovanie v podriadených tabuľkách) a pridávania záznamov alebo zmeny údajov v podriadených tabuľkách.

Objekt (objekt) - prvok informačného systému, ktorý má určité vlastnosti (vlastnosti) a určitým spôsobom reaguje na vonkajšie udalosti (udalosti).

Systém je súbor objektov interagujúcich medzi sebou a s vonkajším prostredím.

Replikácia databázy je vytváranie kópií databázy (repliky), ktoré si môžu vymieňať aktualizované údaje alebo replikované formuláre, zostavy alebo iné objekty ako výsledok procesu synchronizácie.

Transakcia je zmena informácií v databáze v dôsledku vykonania jednej operácie alebo sledu operácií, ktoré sa musia vykonať úplne alebo sa nevykonajú vôbec. DBMS má špeciálne mechanizmy na zabezpečenie transakcií.

SQL (Structured Query Language) je univerzálny jazyk pre prácu s databázami vrátane možnosti jeho vytvorenia, úpravy štruktúry, výberu údajov dotazom, úpravy informácií v databáze a ďalších operácií manipulácie s databázou.

Null je hodnota poľa tabuľky, čo znamená, že v tomto poli nie sú žiadne informácie. Pre jednotlivé polia v tabuľke je možné nastaviť povolenie na existenciu hodnoty Null.

2.2. Klasifikácia databázy

Podľa technológie spracovania údajov sa databázy delia na centralizované a distribuované.

Centralizovaná databáza je uložená v pamäti jedného počítačového systému. Tento výpočtový systém môže byť mainframe - potom je prístup k nemu organizovaný pomocou terminálov - alebo súborový server v lokálnej sieti PC.

Distribuovaná databáza pozostáva z niekoľkých, prípadne sa prelínajúcich alebo dokonca duplikujúcich častí, ktoré sú uložené na rôznych počítačoch v počítačovej sieti. Práca s takouto databázou sa vykonáva pomocou distribuovaného systému správy databáz (RDBMS).

Podľa spôsobu prístupu k údajom sa databázy delia na databázy s lokálnym prístupom a databázy so sieťovým prístupom.

Pre všetky moderné databázy môžete organizovať sieťový prístup s režimom prevádzky pre viacerých používateľov.

Centralizované databázy so sieťovým prístupom môžu mať nasledujúcu architektúru:

  • súborový server;
  • databáza klient-server;
  • "tenký klient" - aplikačný server - databázový server (trojvrstvová architektúra).

Ryža. 1. Schéma práce s databázou v lokálnej sieti s vyhradeným súborovým serverom

Súborový server. Architektúra databázových systémov so sieťovým prístupom predpokladá vyčlenenie jedného zo sieťových strojov ako centrálneho (súborový server). Na tomto počítači je nainštalovaný operačný systém (OS) pre dedikovaný server (napr. Microsoft Windows Server 2003). Tiež ukladá zdieľanú centralizovanú databázu vo forme jedného alebo skupiny súborov. Všetky ostatné počítače v sieti fungujú ako pracovné stanice (môžu používať Microsoft Windows 2000 Professional alebo Microsoft Windows 98). Databázové súbory sa podľa požiadaviek používateľov prenášajú na pracovné stanice, kde sa spracovávajú informácie (obr. 1). Pri vysokej intenzite prístupu k rovnakým údajom klesá výkon informačného systému. Používatelia môžu tiež vytvárať lokálne databázy na pracovných staniciach.

Ryža. 2. Schéma práce s databázou v architektúre "Klient-server".

Klientsky server. V tejto architektúre na dedikovanom serveri, na ktorom beží server operačný systém, je nainštalovaný špeciálny softvér (softvér) - databázový server, ako napríklad Microsoft® SQL Server alebo Oracle. DBMS je rozdelený na dve časti: klient a server. Základom databázového servera je použitie dotazovacieho jazyka (SQL). SQL dotaz odoslaný klientom (pracovnou stanicou) na databázový server generuje vyhľadávanie a získavanie údajov na serveri. Extrahované dáta sú prenášané cez sieť zo servera ku klientovi (obrázok 2). Množstvo informácií prenášaných cez sieť sa tak mnohonásobne zníži.

Trojvrstvová architektúra funguje v intranetových a internetových sieťach. Klientska časť („tenký klient“), ktorá interaguje s používateľom, je stránka HTML vo webovom prehliadači alebo aplikácia Windows, ktorá interaguje s webovými službami. Celá programová logika je umiestnená na aplikačnom serveri, ktorý zabezpečuje tvorbu databázových dotazov, ktoré sa odosielajú na databázový server na vykonanie. Aplikačným serverom môže byť webový server alebo špecializovaný program(napríklad Oracle Forms Server) (obr. 3).

Ryža. 3. Schéma práce s databázou v trojúrovňovej architektúre

2.3. Hierarchické a sieťové dátové modely

V hierarchickom dátovom modeli je jeden hlavný objekt a ostatné – podriadené – objekty umiestnené na rôznych úrovniach hierarchie. Vzťahy objektov tvoria hierarchický strom s jedným koreňovým objektom.

Hierarchická databáza pozostáva z usporiadanej množiny viacerých inštancií rovnakého typu stromu. Referenčná integrita medzi predkami a potomkami je automaticky zachovaná. Základné pravidlo: žiadne dieťa nemôže existovať bez svojho rodiča (obr. 4).

Ryža. 4. Schéma hierarchického dátového modelu

Typickým predstaviteľom (najznámejším a najrozšírenejším) je Information Management System (IMS) od IBM. Prvá verzia sa objavila v roku 1968. Mnohé databázy tohto systému sú stále podporované.

Sieťové databázy

Sieťový prístup k organizácii údajov je rozšírením hierarchického prístupu. V hierarchických štruktúrach musí mať potomok presne jedného rodiča; v sieťovej dátovej štruktúre môže mať dieťa ľubovoľný počet predkov.

V sieťovom dátovom modeli môže byť akýkoľvek objekt súčasne master aj slave a môže sa podieľať na vytváraní ľubovoľného počtu vzťahov s inými objektmi. Sieťová databáza pozostáva zo sady záznamov a sady prepojení medzi týmito záznamami, alebo presnejšie, sady inštancií každého typu zo sady typov záznamov špecifikovaných v schéme databázy a sady inštancií každého typu z daný súbor typov odkazov (obr. 5).

Ryža. 5. Schéma dátového modelu siete

Typickým predstaviteľom je Integrated Database Management System (IDMS) od Cullinet Software, Inc., navrhnutý pre použitie na bežných strojoch IBM s väčšinou operačných systémov. Architektúra systému je založená na návrhoch Data Base Task Group (DBTG) Výboru pre programovacie jazyky Konferencie pre jazyky dátových systémov (CODASYL), organizácie zodpovednej za definovanie programovacieho jazyka Cobol. Správa DBTG bola publikovaná v roku 1971 a neskôr sa objavilo niekoľko systémov, medzi nimi IDMS.

2.4. Relačné databázy

Relačné systémy sa nerozšírili okamžite. Zatiaľ čo hlavné teoretické výsledky v tejto oblasti boli dosiahnuté už v 70. rokoch a zároveň sa objavili prvé prototypy relačných DBMS, dlho sa považovalo za nemožné dosiahnuť efektívnu implementáciu takýchto systémov. Postupná akumulácia metód a algoritmov na organizáciu relačných databáz a ich správu však viedla k tomu, že už v polovici 80. rokov relačné systémy prakticky vytlačili skoré DBMS zo svetového trhu.

Relačný dátový model je založený na matematických princípoch, ktoré vyplývajú priamo z teórie množín a predikátovej logiky. Tieto princípy boli prvýkrát aplikované v oblasti dátového modelovania koncom 60. rokov 20. storočia. od Dr. E. F. Codda, potom v IBM a prvýkrát publikovaný v roku 1970.

Technický dokument "The Relational Data Model for Large Shared Data Banks" od Dr. E. F. Codda, publikovaný v roku 1970, je predchodcom modernej teórie relačných databáz. Dr. Codd definoval 13 pravidiel pre relačný model (nazývaných trinásť Coddových pravidiel).

13 pravidiel Codda

  1. Relačný DBMS musí byť schopný plne spravovať databázu prostredníctvom svojich relačných schopností.
  2. Informačné pravidlo - Všetky informácie v relačnej databáze (vrátane názvov tabuliek a stĺpcov) musia byť definované striktne ako hodnoty v tabuľkách.
  3. Zaručený prístup – Akákoľvek hodnota v relačnej databáze musí byť zaručená na použitie prostredníctvom kombinácie názvu tabuľky, hodnoty primárneho kľúča a názvu stĺpca.
  4. Podpora nulových hodnôt - DBMS musí byť schopný pracovať s nulovými hodnotami (neznáme alebo nepoužité hodnoty), na rozdiel od predvolených hodnôt a nezávisle pre akékoľvek domény.
  5. Online relačný katalóg - popis databázy a jej obsah by mal byť reprezentovaný na logickej úrovni ako tabuľky, na ktoré je možné aplikovať dotazy pomocou databázového jazyka.
  6. Komplexný jazyk správy údajov – Aspoň jeden z podporovaných jazykov musí mať dobre definovanú syntax a musí byť komplexný. Musí podporovať popis štruktúry údajov a manipuláciu s nimi, pravidlá integrity, autorizáciu a transakcie.
  7. Pravidlo aktualizácie pohľadov – všetky pohľady, ktoré sú teoreticky aktualizovateľné, je možné aktualizovať cez systém.
  8. Vložiť, aktualizovať a odstrániť – DBMS podporuje nielen dotaz na výber údajov, ale aj vkladanie, aktualizáciu a mazanie.
  9. Fyzická dátová nezávislosť – aplikačné programy a špeciálne programy nie sú logicky ovplyvnené zmenami fyzikálne metódyštruktúry prístupu k údajom a ich ukladanie.
  10. Logická nezávislosť dát - aplikačné programy a špeciálne programy nie sú logicky ovplyvnené zmenami v štruktúre tabuliek.
  11. Nezávislosť integrity − Jazyk databázy musí byť schopný definovať pravidlá integrity. Musia byť uložené v online adresári a nesmie sa dať obísť.
  12. Nezávislosť distribúcie – Aplikačné programy a špeciálne programy nie sú logicky ovplyvnené tým, či sa údaje použijú prvýkrát alebo opakovane.
  13. Kontinuita – nemožnosť obísť pravidlá integrity definované prostredníctvom databázového jazyka pomocou jazykov nízky level.

Základnou myšlienkou relačnej algebry je, že keďže vzťahy sú množiny, prostriedky manipulácie vzťahov môžu byť založené na tradičných operáciách teórie množín, doplnených o niektoré špeciálne operáciešpecifické pre relačné databázy.

Existuje mnoho prístupov k definícii relačnej algebry, ktoré sa líšia v súboroch operácií a spôsobe ich interpretácie, ale v zásade sú viac-menej ekvivalentné. Rozšírená počiatočná verzia algebry, ktorú navrhol Codd, sa nazýva Coddova algebra.

V tejto verzii sa množina základných algebraických operácií skladá z ôsmich operácií, ktoré sú rozdelené do dvoch tried – množinovo-teoretické operácie a špeciálne relačné operácie. Operácie teoretické množín zahŕňajú nasledujúce operácie:

  • asociácia vzťahov;
  • križovatky vzťahov;
  • brať rozdiel pomerov;
  • pričom karteziánsky súčin pomerov.

Špeciálne relačné operácie zahŕňajú:

  • obmedzenie vzťahu;
  • projekcia postoja;
  • prepojenie vzťahov;
  • rozdelenie vzťahov.

Okrem toho algebra obsahuje operáciu priradenia, ktorá umožňuje uložiť výsledky výpočtu algebraických výrazov do databázy, a operáciu premenovania atribútov, ktorá umožňuje správne zostaviť názov (schému) výsledného vzťahu.

  • Pri vykonávaní operácie UNION dvoch relácií s rovnakými hlavičkami sa vytvorí relácia, ktorá zahŕňa všetky n-tice, ktoré sú zahrnuté aspoň v jednej z relácií - operandov.
  • Operácia prieniku (INTERSECT) dvoch relácií s rovnakými nadpismi vytvorí reláciu, ktorá zahŕňa všetky n-tice, ktoré sú zahrnuté v oboch operandových vzťahoch.
  • Relácia, ktorá je rozdielom (MINUS) dvoch relácií s rovnakými nadpismi, zahŕňa všetky n-tice vo vzťahu prvého operandu tak, že žiadna z nich nie je vo vzťahu druhého operandu.
  • Vykonaním karteziánskeho súčinu (TIMES) dvoch relácií, ktorých hlavičky sa pretínajú, sa vytvorí relácia, ktorej n-tice sú vytvorené zreťazením n-tic prvého a druhého operandu.
  • Výsledkom obmedzenia (WHERE) vzťahu na základe nejakej podmienky je vzťah, ktorý zahŕňa n-tice vzťahu operandu, ktorý spĺňa danú podmienku.
  • Pri vykonávaní projekcie (PROJEKTU) vzťahu na danú podmnožinu množiny jej atribútov sa vytvorí vzťah, ktorého n-tice sú zodpovedajúcimi podmnožinami n-tic relačného operandu.
  • Pri spojení (JOIN) dvoch relácií podľa nejakej podmienky vznikne výsledný vzťah, ktorého n-tice vznikajú spojením n-tic prvého a druhého vzťahu a spĺňajú túto podmienku.
  • Operátor relačného delenia (DIVIDE BY) má dva operandy – binárne a unárne vzťahy. Výsledný vzťah pozostáva z unárnych n-tic, ktoré zahŕňajú hodnoty prvého atribútu n-tic prvého operandu tak, že množina hodnôt druhého atribútu (s pevnou hodnotou prvého atribútu) obsahuje množinu hodnoty druhého operandu.
  • Operácia premenovania (RENAME) vytvorí vzťah, ktorého telo je rovnaké ako telo operandu, ale názvy atribútov boli zmenené.
  • Operátor priradenia (:=) vám umožňuje uložiť výsledok vyhodnotenia relačného výrazu v existujúcom databázovom vzťahu.

Codd navrhol použitie relačnej algebry v RDBMS na rozdelenie údajov do súvisiacich súborov. Svoj DB systém zorganizoval podľa konceptu založeného na súboroch údajov.

V relačnom modeli sú dáta rozdelené do množín, ktoré tvoria tabuľkovú štruktúru. Táto tabuľková štruktúra pozostáva z jednotlivých dátových prvkov nazývaných polia. Jeden súbor alebo skupina polí sa nazýva záznam.

Dátový model alebo konceptuálny popis predmetnej oblasti je najabstraktnejšou úrovňou návrhu databázy.

Z hľadiska teórie relačných databáz možno základné princípy relačného modelu na konceptuálnej úrovni formulovať takto:

  • všetky údaje sú reprezentované ako usporiadaná štruktúra, definovaná ako riadky a stĺpce a nazývaná vzťah;
  • všetky hodnoty sú skalárne. To znamená, že pre každý riadok a stĺpec akéhokoľvek vzťahu existuje iba jedna hodnota;
  • všetky operácie sa vykonávajú na celočíselnom vzťahu a výsledkom ich vykonania je tiež celočíselný vzťah. Tento princíp sa nazýva uzavretie.

Doktor Codd si pri formulovaní princípov relačného modelu zvolil pojem „vzťah“ (relácia), pretože tento pojem je podľa neho jednoznačný (zatiaľ čo napr. pojem „tabuľka“ má mnoho rôznych typov – tabuľka v text, tabuľka a pod.). Bežnou mylnou predstavou je, že relačný model je takto pomenovaný, pretože definuje vzťahy medzi tabuľkami. V skutočnosti názov tohto modelu pochádza zo vzťahov (databázových tabuliek), ktoré sú jeho základom.

Každý riadok obsahujúci údaje sa nazýva n-tica, každý stĺpec vzťahu sa nazýva atribút (na úrovni praktickej práce s modernými relačnými databázami sa používajú pojmy „záznam“ a „pole“).

Prvky popisu relačného dátového modelu na konceptuálnej úrovni sú entity, atribúty, domény a vzťahy.

Entita je nejaký samostatný objekt alebo udalosť, o ktorej musí byť informácia uložená v databáze, ktorá má určitý súbor vlastností – atribútov. Entity môžu byť fyzické (skutočné objekty: napríklad ŠTUDENT, atribúty - číslo ročníka, priezvisko, jeho fakulta, odbor, číslo skupiny atď.), ako aj abstraktné (napríklad SKÚŠKA, atribúty - disciplína, dátum, učiteľ, publikum atď.). Entity sa rozlišujú podľa typu a inštancie. Typ je charakterizovaný názvom a zoznamom vlastností, zatiaľ čo inštancia je charakterizovaná špecifickými hodnotami vlastností.

Atribúty entity sú:

  1. identifikačné a popisné. Identifikačné atribúty majú jedinečnú hodnotu pre entity daného typu a sú potenciálnymi kľúčmi. Umožňujú vám jedinečne rozpoznať inštancie entity. Z kandidátskych kľúčov sa vyberie jeden primárny kľúč (PC). Ako PC sa zvyčajne volí potenciálny kľúč, ktorý sa častejšie používa na prístup k inštanciám záznamov. PC by malo obsahovať minimálny počet atribútov požadovaných na identifikáciu. Zvyšné atribúty sa nazývajú popisné.
  2. Jednoduché a zložené. Jednoduchý atribút pozostáva z jedného komponentu, jeho hodnota je nedeliteľná. Zložený atribút je kombináciou niekoľkých komponentov, ku ktorým môže patriť odlišné typyúdaje (napríklad adresa). Rozhodnutie, či použiť zložený atribút alebo ho rozdeliť na komponenty, závisí od konkrétnych procesov jeho použitia a môže byť spojené s vysokou rýchlosťou práce s veľkými databázami.
  3. Jednohodnotné a viachodnotové- môže mať jednu alebo viac hodnôt pre každú inštanciu entity.
  4. Základné a odvodené. Hodnota hlavného atribútu nezávisí od ostatných atribútov. Hodnota odvodeného atribútu sa vypočíta z hodnôt iných atribútov (napríklad vek osoby sa vypočíta z dátumu narodenia a aktuálneho dátumu).

Špecifikácia atribútu pozostáva z jeho názvu, typu údajov a obmedzení integrity, množiny hodnôt (alebo domény), ktoré môže atribút nadobudnúť.

Doména je množina všetkých platných hodnôt, ktoré môže atribút obsahovať. Pojem „doména“ sa často zamieňa s pojmom „typ údajov“. Je potrebné rozlišovať medzi týmito dvoma pojmami. Dátový typ je fyzický koncept, zatiaľ čo doména je logický koncept. Napríklad „celé číslo“ je typ údajov a „vek“ je doména.

Vzťahy – na koncepčnej úrovni sú to jednoduché asociácie medzi entitami. Napríklad vyhlásenie „Zákazníci nakupujú produkty“ naznačuje, že medzi entitami „Zákazníci“ a „Produkty“ existuje vzťah a takéto subjekty sa nazývajú členmi tohto vzťahu.

Existuje niekoľko typov vzťahov medzi dvoma entitami: sú to vzťahy jedna k jednej, jedna k mnohým a mnoho k mnohým.

Každý vzťah vo vzťahovom modeli je charakterizovaný názvom, požiadavkou, typom a rozsahom. Rozlišujte medzi voliteľnými a povinnými odkazmi. Ak entita jedného typu nevyhnutne súvisí s entitou iného typu, potom medzi týmito typmi objektov existuje povinný vzťah (označený dvojitou čiarou). V opačnom prípade je pripojenie voliteľné.

Stupeň vzťahu je určený počtom subjektov, na ktoré sa tento vzťah vzťahuje. Príkladom binárneho vzťahu je vzťah medzi oddelením a zamestnancami, ktorí v ňom pracujú.

Entity-Relationship diagramy alebo E/R diagram sa používajú na popis základnej schémy na úrovni koncepčného návrhu. Metódu navrhol v roku 1976 Peter Pin Shan Chen. Diagramy entít a vzťahov zobrazujú entity ako obdĺžniky, atribúty ako elipsy a vzťahy ako kosoštvorce (obrázok 6).

Ryža. 6. Entita-vzťahový diagram

Následne mnohí autori vyvinuli vlastné verzie takýchto modelov (Martinova notácia, IDEF1X notácia, Barkerova notácia atď.). Okrem toho sa rôzne softvérové ​​nástroje, ktoré implementujú rovnakú notáciu, môžu líšiť vo svojich schopnostiach. V skutočnosti všetky varianty diagramov entít a vzťahov vychádzajú z rovnakej myšlienky – obrázok je vždy jasnejší ako textový popis. Všetky takéto diagramy využívajú grafické znázornenie entít predmetnej oblasti, ich vlastností (atribútov) a vzťahov medzi entitami.

Návrh databázovej schémy by mal vyriešiť problém minimalizácie duplicitných údajov, zjednodušenia a zrýchlenia postupov pri ich spracovaní a aktualizácii. Nesprávne navrhnutá schéma databázy môže viesť k anomáliám úpravy údajov. Na vyriešenie takýchto problémov sa uskutočňuje normalizácia vzťahov.

V technológii práce s dátovými skladmi je však možné využiť aj obrátenú techniku ​​- denormalizáciu vzťahov s cieľom zvýšiť rýchlosť vykonávania dopytov na veľmi veľké objemy archivovaných dát.

V rámci relačného dátového modelu E. F. Codd vyvinul princípy normalizácie vzťahov a navrhol mechanizmus, ktorý umožňuje previesť akýkoľvek vzťah do tretej normálnej formy.

Normalizácia je formálna metóda na analýzu vzťahov na základe ich primárneho kľúča a existujúcich vzťahov. Jeho úlohou je nahradiť jednu databázovú schému (alebo množinu vzťahov) inou schémou, v ktorej majú vzťahy jednoduchšiu a pravidelnejšiu štruktúru.

Pri práci s relačným modelom na vytvorenie vzťahov prijateľnej kvality stačí splniť požiadavky prvej normálnej formy.

Prvá normálna forma (1NF) sa zaoberá pojmami jednoduchých a zložitých atribútov. Jednoduchý atribút je atribút, ktorého hodnoty sú atómové (t. j. nedeliteľné). Komplexný atribút môže mať hodnotu, ktorá je spojením viacerých hodnôt z rovnakých alebo rôznych domén. V prvej normálnej forme sa eliminujú duplicitné atribúty alebo skupiny atribútov, t. j. identifikujú sa implicitné entity „zamaskované“ za atribúty.

Vzťah sa zníži na 1NF, ak sú všetky jeho atribúty jednoduché, t. j. hodnota atribútu nesmie byť množina alebo opakujúca sa skupina.

Aby sa tabuľky dostali do 1NF, je potrebné rozdeliť zložité atribúty na jednoduché a presunúť atribúty s viacerými hodnotami do samostatných vzťahov.

Druhá normálna forma (2NF) sa vzťahuje na vzťahy so zloženými kľúčmi (pozostávajúcimi z dvoch alebo viacerých atribútov) a súvisí s konceptmi funkčnej závislosti.

Ak kedykoľvek každá hodnota atribútu A zodpovedá jedinej hodnote atribútu B, potom B je funkčne závislý od A (AB). Atribút (skupina atribútov) A sa nazýva determinátor.

V druhej normálnej forme sú eliminované atribúty, ktoré závisia iba od časti jedinečného kľúča. Táto časť jedinečného kľúča identifikuje jednu entitu.

Vzťah je v 2NF, ak je redukovaný na 1NF a každý nekľúčový atribút je plne funkčne závislý od zloženého primárneho kľúča.

Tretia normálna forma (3NF) súvisí s pojmom tranzitívna závislosť. Nech A, B, C sú atribúty nejakého vzťahu. Navyše, A B a B C, ale neexistuje inverzná korešpondencia, t. j. C nezávisí od B alebo B nezávisí od A. Potom hovoríme, že C tranzitívne závisí od A (A C).

Tretia normálna forma eliminuje atribúty, ktoré závisia od atribútov, ktoré nie sú súčasťou jedinečného kľúča. Tieto atribúty sú základom jedinej entity.

Vzťah je v 3NF, ak je v 2NF a nemá žiadne atribúty, ktoré nie sú v primárnom kľúči a sú prechodne závislé od primárneho kľúča.

Existujú aj normálne formy Boyce-Codda (BCNF), 4NF a 5NF. 1NF má však najväčší význam, keďže nasledujúce NF sa zaoberajú pojmami zložených kľúčov a zložitých kľúčových závislostí av praxi sa zvyčajne vyskytujú jednoduchšie prípady.

Modelovanie štruktúry databázy pomocou normalizačného algoritmu má vážne nevýhody:

  1. Technika normalizácie zahŕňa počiatočné umiestnenie všetkých atribútov projektovanej tematickej oblasti do jedného vzťahu, čo je veľmi neprirodzená operácia. Vývojár intuitívne navrhne niekoľko vzťahov naraz podľa zistených entít. Aj keď sa dopustíte násilia na sebe a vytvoríte si jeden alebo viacero vzťahov, vrátane všetkých údajných atribútov v nich, potom je zmysel výsledného vzťahu úplne nejasný.
  2. Nie je možné okamžite určiť úplný zoznam atribútov. Používatelia majú vo zvyku telefonovať rôzne mená rovnaké veci alebo naopak nazývať rôzne veci rovnakými menami.
  3. Na vykonanie normalizačného postupu je potrebné izolovať závislosti atribútov, čo je tiež veľmi ťažké.

Pri reálnom návrhu štruktúry databázy sa používa iná metóda - takzvané sémantické modelovanie. Sémantické modelovanie je modelovanie dátových štruktúr na základe významu týchto dát. Ako nástroj sémantického modelovania sa pri konštrukcii konceptuálneho databázového modelu používajú rôzne verzie diagramov entít a vzťahov (ERD).

Každý odborník, ktorý má všeobecné zásady optimálna organizácia relačných databáz, schopná zostaviť model, ktorý nie je v rozpore s princípmi normalizácie.

Relačnú databázu na fyzickej úrovni tvoria tabuľky, medzi ktorými môžu existovať vzťahy podľa kľúčových hodnôt. Spolu s tabuľkami a informáciami o vzťahoch v relačnej databáze môžu existovať „uložené procedúry“ a najmä „spúšťače“, ktoré zabezpečujú súlad s podmienkami referenčnej integrity databázy.

Súlad s podmienkami referenčnej integrity v relačnej databáze

Pravidlo párovania cudzích kľúčov s primárnymi je hlavným pravidlom pre dodržanie podmienok referenčnej integrity. Pre každú hodnotu cudzieho kľúča musí existovať zodpovedajúca hodnota primárneho kľúča v nadradenej tabuľke.

Referenčná integrita môže byť narušená v dôsledku operácií vloženia (pridania), aktualizácie a vymazania v tabuľkách. V referenčnej integrite sú zahrnuté dve tabuľky, nadradená a podradená, a tieto operácie sú možné pre každú z nich, takže existuje šesť rôznych možností, ktoré môžu alebo nemusia viesť k narušeniu referenčnej integrity.

Pre nadradenú tabuľku:

  • Vložiť. Existuje nová hodnota primárneho kľúča. Existencia záznamov v rodičovskej tabuľke, na ktoré sa neodkazuje z podradenej tabuľky, je povolená, operácia neporušuje referenčnú integritu.
  • Aktualizovať. Zmena hodnoty primárneho kľúča v zázname môže viesť k narušeniu referenčnej integrity.
  • Odstránenie. Vymazaním záznamu sa vymaže hodnota primárneho kľúča. Ak sú v podradenej tabuľke záznamy, ktoré odkazujú na kľúč vymazaného záznamu, hodnoty cudzieho kľúča sa stanú neplatnými. Operácia môže viesť k porušeniu referenčnej integrity.

Pre detský stôl:

  • Vložiť. Do podradenej tabuľky nemôžete vložiť záznam, ak nový vstup hodnota cudzieho kľúča je neplatná. Operácia môže viesť k porušeniu referenčnej integrity.
  • Aktualizovať. Keď aktualizujete záznam v podradenej tabuľke, môžete sa pokúsiť nesprávne zmeniť hodnotu cudzieho kľúča. Operácia môže viesť k porušeniu referenčnej integrity.
  • Odstránenie. Odstránenie záznamu v podradenej tabuľke nenaruší referenčnú integritu.

Referenčná integrita môže byť teda v zásade narušená jednou zo štyroch operácií:

  1. Aktualizujte záznamy v nadradenej tabuľke.
  2. Odstránenie záznamov v nadradenej tabuľke.
  3. Vkladanie záznamov do podradenej tabuľky.
  4. Aktualizujte záznamy v podradenej tabuľke.

Základné stratégie na udržanie referenčnej integrity

Existujú dve hlavné stratégie na udržanie referenčnej integrity.

OBMEDZENIE (RESTRICT) – neumožňujú vykonanie operácie, ktorá vedie k narušeniu referenčnej integrity.

KASKÁDOVÁ (KASKÁDOVÁ ZMENA) - umožňujú vykonať požadovanú operáciu, ale v príslušných tabuľkách vykonajte potrebné zmeny tak, aby sa zabránilo narušeniu referenčnej integrity a zachovali sa všetky existujúce vzťahy. Zmena začína v nadradenej tabuľke a prechádza cez podradené tabuľky. Implementácia tejto stratégie má jednu jemnosť, a to, že samotné podradené tabuľky môžu byť rodičmi niektorých tretích tabuliek. To môže dodatočne vyžadovať vykonanie nejakej stratégie pre toto pripojenie atď. Ak v tomto prípade nie je možné vykonať niektorú z kaskádových operácií (akejkoľvek úrovne), je potrebné opustiť počiatočnú operáciu a vrátiť databázu do jej pôvodný stav. Ide o komplexnú stratégiu, ktorá však nenarúša vzťahy medzi nadradenými a podradenými tabuľkami.

Tieto stratégie sú štandardné a sú prítomné vo všetkých DBMS, ktoré podporujú referenčnú integritu.

Ďalšie stratégie na udržanie referenčnej integrity

IGNOROVAŤ (IGNORE) – umožňuje vykonanie operácie bez kontroly referenčnej integrity. V tomto prípade sa v podradenej tabuľke môžu objaviť nesprávne hodnoty cudzieho kľúča a celá zodpovednosť za integritu databázy leží na programátorovi alebo používateľovi.

SET NULL - Umožní vykonať požadovanú operáciu, ale zmeňte všetky výsledné nesprávne hodnoty cudzieho kľúča na hodnoty null. Táto stratégia má dve nevýhody. Po prvé, vyžaduje povolenie na používanie hodnôt null. Po druhé, záznamy podradenej tabuľky strácajú vzťah so záznamami nadradenej tabuľky. Už nie je možné určiť, s ktorým záznamom nadradenej tabuľky boli po operácii spojené zmenené záznamy podradenej tabuľky.

SET DEFAULT (SET THE DEFAULT VALUE) - povoliť vykonanie požadovanej operácie, ale zmeňte akékoľvek nesprávne hodnoty cudzieho kľúča, ktoré sa vyskytnú, na nejakú predvolenú hodnotu. Výhodou tejto stratégie oproti predchádzajúcej je, že sa vyhýba používaniu nulových hodnôt. Po vykonaní takejto operácie je tiež nemožné určiť, s ktorými záznamami nadradenej tabuľky boli zmenené záznamy podradenej tabuľky spojené.

Na obr. Obrázok 7 zobrazuje príklad relačnej databázy obsahujúcej informácie z personálneho oddelenia o zamestnancoch podniku, v ktorej je pre každú tabuľku zobrazený zoznam jej polí a vzťahy medzi tabuľkami sú znázornené jednoduchým kľúčom - hodnotou poľa tabn .

Ryža. 7. Schéma relačnej databázy

Od 80. rokov 20. storočia spolu s rozšíreným používaním osobných počítačov vznikali takzvané „desktopové“ relačné DBMS (Desktop Databases), ako sú dBase, FoxBase (jeho neskoršie verzie – FoxPro a Visual FoxPro), Paradox, Access. Najbežnejším formátom tabuliek takýchto relačných databáz bol *.dbf, s ktorým pracovali dBase, FoxBase a tiež Clipper - systém na písanie programov (v režime prekladača reťazcov) na prácu s databázami. Následne sa z niektorých stali plnohodnotné sieťové DBMS, ktoré fungujú nielen na rôznych operačných systémoch v architektúre file-server, ale majú schopnosť pracovať s databázovými servermi v architektúre klient-server, ako aj vyvíjať a používať html. - databázové stránky.

Všetky DBMS pre PC možno rozdeliť do troch typov:

  1. Systémy na správu databáz v prenesenom zmysle slova, pre ktoré je práca s databázami možná až po spustení tohto systému bez možnosti vytvárania samostatných programov pracujúcich s databázami. Medzi tieto systémy patria: Access, Paradox, dBase.
  2. Systémy, ktoré majú ako nástroje na prácu s databázami, tak aj možnosť vývoja používateľských programov (aplikácií) spustiteľných v operačnom systéme, teda nástroje pre vývojárov softvéru – FoxPro.
  3. Systémy pre vývoj užívateľských programov pre prácu s databázami - Clipper, Clarion.

Všetky takéto DBMS zahŕňajú nástroje pre:

  • vytváranie databáz a úprava ich štruktúry; vytváranie indexových súborov;
  • práca s databázami v tabuľkovom formáte alebo vo forme štandardného formulára s usporiadaním polí riadok po riadku; je možné údaje upravovať, pridávať záznamy, mazať záznamy, pracovať s údajmi z viacerých databázových tabuliek, počítať zložité výrazy pre dané podmienky a pod.;
  • vývoj obrazovkových formulárov, ktoré majú okrem editovateľných polí spojených s databázou alebo pamäťovými premennými aj ovládacie prvky iný druh vo forme gombíkov; zložitejšie objekty, ako sú rozbaľovacie zoznamy atď.;
  • generovanie tlačených formulárov - zostavy komplexnej štruktúry so zoskupením údajov, s prijímaním vypočítaných hodnôt a súčtov podľa skupín a súčtov (súčet, počet, priemer, maximum, minimum atď.);
  • Vývoj softvérových modulov pre komplexné spracovanie údajov;
  • generovanie dotazov veľmi zložitej štruktúry – využitie údajov z rôznych databáz, nastavenie zložitých podmienok pre výber údajov, triedenie a zoskupovanie údajov.

V systémoch orientovaných na vývojárov je navyše možné vyvinúť menu, systém pomoci a projekt, ktorý obsahuje všetky vyššie uvedené komponenty a je zostavený do spustiteľného programu.

Dôležité faktory určujúce výber DBMS sú:

  • Databázový formát, ktorý umožňuje výmenu informácií s inými aplikáciami operačného systému. Jedným z najbežnejších formátov je formát dbf, s ktorým pracujú dBase, FoxBase, FoxPro, Visual FoxPro, Clipper. „Rozumejú“ mu všetky aplikácie MS Office. Dáta z týchto databáz je možné preniesť do Wordu, Excelu, Accessu. Clarion, Paradox, Access majú svoje vlastné dátové formáty.
  • Zabezpečenie utajenia a dôvernosti údajov majú systémy, ktoré nie sú zamerané na vývojárov programov: Access, Paradox. Tento faktor je však možné implementovať pri ukladaní údajov na dedikovaný server, kde sa dajú ľahko rozlíšiť práva rôznych používateľov.

Všetky moderné DBMS podporujú prevádzkové režimy v lokálnej sieti mnohých používateľov s jednou databázou. Niektoré majú „sprievodcov“, „staviteľov“ a „generátory výrazov“ na zrýchlený vývoj databáz, obrazovkových formulárov, zostáv, štandardných aplikácií.

Najnovšie verzie DBMS navrhnuté pre prácu v OC Windows 95 patria do triedy systémov RAD (Rapid Application Development) - nástrojov na rýchly vývoj aplikácií - a majú objektovo orientovaný programovací jazyk. Ide o systémy ako Visual FoxPro, MS Access, Visual dBase atď.

Postrelačné databázy

V súčasnosti sú známe aj takzvané postrelačné DBMS, ktoré sú založené na dátovom modeli vo forme viacrozmerných tabuliek (napríklad v systéme Cache spoločnosti InterSystems Corporation) a širokom využívaní princípov objektovo orientovaného prístupu. pri organizovaní databáz a programovaní.

Databázové servery

Servery sú široko používané v lokálnych a globálnych počítačových sieťach: počítače a softvérové ​​nástroje na obsluhu klientov - pracovných staníc a / alebo iných serverov.

Príklady serverov môžu byť:

  • súborový server, ktorý udržiava zdieľané úložisko súborov pre všetky pracovné stanice;
  • internetový server, ktorý poskytuje informácie na globálnom internete;
  • poštový server, ktorý zabezpečuje prácu s e-mailom;
  • databázový server - DBMS, ktorý prijíma požiadavky cez lokálnu sieť a vracia informácie zodpovedajúce požiadavke.

Termín "databázový server" sa zvyčajne používa na označenie celého DBMS založeného na architektúre "klient-server", vrátane serverovej aj klientskej časti. Najbežnejšími servermi sú v súčasnosti Microsoft SQL Server, Oracle, IBM DB2 Universal DataBase, Informix atď. Veľkosť jednej databázy na týchto serveroch môže dosiahnuť jeden milión terabajtov.

2.5. Distribuované databázy

Hlavnou úlohou systémov riadenia distribuovaných databáz je poskytnúť prostriedky na integráciu lokálnych databáz umiestnených v niektorých uzloch počítačovej siete tak, aby používateľ pracujúci v ktoromkoľvek uzle siete mal prístup ku všetkým týmto databázam ako k jednej databáze.

Možné sú homogénne a heterogénne distribuované databázy. V homogénnom prípade je každá lokálna databáza riadená rovnakým DBMS. V heterogénnom systéme môžu lokálne databázy dokonca patriť do rôznych dátových modelov. Sieťová integrácia heterogénnych databáz je veľmi ťažký problém. V teoretickej rovine je známych veľa riešení, ale doteraz sa nepodarilo vyrovnať sa s hlavným problémom: nedostatočnou efektívnosťou integrovaných systémov. Úspešnejšie je vyriešená stredná úloha - integrácia heterogénnych systémov orientovaných na SQL. To je do značnej miery uľahčené štandardizáciou jazyka SQL.

Príkladom distribuovaného DBMS je System R*. V tomto systéme zostávajú vývojári aplikácií a koncoví používatelia v prostredí jazyka SQL. Schopnosť používať SQL závisí od toho, že System R* je transparentný, pokiaľ ide o umiestnenie údajov. Systém automaticky zistí aktuálnu polohu dátových objektov uvedených v požiadavke užívateľa; ten istý aplikačný program, vrátane príkazov SQL, môže byť spustený v rôznych sieťových uzloch. Zároveň sa v každom sieťovom uzle vo fáze kompilácie dotazu vyberie najoptimálnejší plán vykonávania dotazu v súlade s umiestnením údajov v distribuovanom systéme.

Čitateľ

Názov práce anotácia

Workshopy

Názov workshopu anotácia

Prezentácie

Názov prezentácie anotácia
Prezentácie k téme 2

Keď hovoríme podrobnejšie o klasifikácii databáz podľa povahy uložených informácií, spomenieme faktické a dokumentárne.

V systémoch faktografického typu sú v databáze uložené informácie o objektoch predmetnej oblasti, ktoré sú pre používateľa zaujímavé, vo forme „faktov“ (napríklad biografické údaje o zamestnancoch, údaje o výstupe produktov od výrobcov, atď.). V reakcii na požiadavku používateľa sa vydajú požadované informácie o objekte (objektoch), ktorý ho zaujíma, alebo správa, že požadované informácie nie sú v databáze.

Úložnou jednotkou je v dokumentárnych databázach dokument (napríklad text zákona alebo článku) a na jeho žiadosť je používateľovi poskytnutý buď odkaz na dokument alebo samotný dokument, v ktorom môže nájsť informácie, ktoré ho zaujímajú.

Databázy dokumentárneho typu možno organizovať rôznymi spôsobmi: bez uloženia a s uložením samotného originálneho dokumentu na strojové médium. Systémy prvého typu zahŕňajú bibliografické a abstraktné databázy, ako aj databázové indexy, ktoré odkazujú na zdroj informácií. Systémy, ktoré umožňujú ukladanie úplného textu dokumentu, sa nazývajú fulltextové.

V systémoch dokumentového typu môžu byť cieľom vyhľadávania nielen niektoré informácie uložené v dokumentoch, ale aj samotné dokumenty. Možné sú teda otázky typu „koľko dokumentov bolo vytvorených v určitom časovom období“ atď.. Kritériá vyhľadávania často zahŕňajú „dátum prijatia dokumentu“, „kým“ a ďalšie „výstupné údaje“ dokumenty ako funkcie.

Klasifikácia databázy podľa spôsobu ukladania údajov

Keď už hovoríme podrobnejšie o databázach klasifikovaných podľa povahy ukladania informácií, zdôrazníme, že centralizované a distribuované databázy znamenajú možnosť súčasného prístupu viacerých používateľov k rovnakým informáciám (multi-užívateľský, paralelný prístup). To prináša špecifické problémy pri ich návrhu a počas prevádzky databázy.

Obrázok 4 - Príklad centralizovanej databázy

Distribuované databázy majú tiež vlastnosti súvisí s tým, že fyzicky rôzne časti databázy môžu byť umiestnené na rôznych počítačoch, no logicky z pohľadu používateľa musia byť jedným celkom.


Obrázok 5 - Príklad distribuovaných databáz

Databázový softvér sa nazýva systém správy databáz (DBMS).

Koncept „DBMS“

Systém správy databáz je súbor jazykových a softvérových nástrojov, ktoré pristupujú k údajom, umožňujú ich vytváranie, upravovanie a mazanie, zaisťujú bezpečnosť údajov atď. Vo všeobecnosti je DBMS systém, ktorý vám umožňuje vytvárať databázy a manipulovať s informáciami z nich. A tento prístup k údajom DBMS vykonáva prostredníctvom špeciálneho jazyka - SQL.

SQL je štruktúrovaný dopytovací jazyk, ktorého hlavnou úlohou je poskytovať ľahká cestačítanie a zápis informácií do databázy.

takže, najjednoduchší obvod práca s databázou vyzerá takto:


Obrázok 6 - Schéma práce s databázou

Klasifikácia podľa dátového modelu:

  • 1. Hierarchický- ide o dátový model, ktorý využíva databázovú reprezentáciu vo forme stromovej (hierarchickej) štruktúry pozostávajúcej z objektov (údajov) rôzne úrovne. Medzi objektmi existujú prepojenia, každý objekt môže obsahovať niekoľko objektov nižšej úrovne. Takéto objekty sú vo vzťahu k predkovi (objekt bližšie ku koreňu) k potomkovi (objekt nižšej úrovne), pričom je možné, že objekt predka nemá potomkov alebo ich má niekoľko, zatiaľ čo podriadený objekt musí mať len jedného predka. Objekty, ktoré majú spoločného predka, sa nazývajú dvojčatá (v programovaní sa vo vzťahu k dátovej štruktúre strom nazýva bratia);
  • 2. Objektovo a objektovo orientované- sú databázový riadiaci systém, v ktorom sú informácie prezentované vo forme objektov, používané v objektovo orientovanom programovaní. Objektové databázy sa líšia od relačných databáz, ktoré sú orientované na tabuľku. Objektové relačné databázy sú hybridom oboch prístupov. O objektových databázach sa uvažovalo na začiatku 80. rokov;
  • 3. Objektovo-relačný DBMS (ORDBMS)-- relačný DBMS (RDBMS), ktorý podporuje niektoré technológie implementujúce objektovo orientovaný prístup: objekty, triedy a dedičnosť sú implementované v štruktúre databázy a dotazovacom jazyku.

Objektovo-relačné DBMS sú napríklad známe Oracle Database, Informix, DB2, PostgreSQL;

  • 4. Relačný dátový model (RMD)-- logický dátový model, aplikovaná teória konštrukcie databáz, ktorá je aplikáciou na problémy spracovania dát takých úsekov matematiky, ako je teória množín a logika prvého rádu. Relačné databázy sú postavené na modeli relačných údajov;
  • 5. sieťový dátový model-- logický dátový model, ktorý je rozšírením hierarchického prístupu, rigoróznej matematickej teórie, ktorá popisuje štrukturálny aspekt, aspekt integrity a aspekt spracovania údajov v sieťových databázach;
  • 6. funkčný dátový model používa tento prístup na definovanie objektu. Namiesto reprezentovania objektu ako záznamu so špecifickým obsahom alebo ako n-tice v B-strome funkčný model hovorí, aké funkcie (alebo operácie) sú na tomto objekte definované. Reprezentácia objektu je realizačnou záležitosťou a je definovaná na nižšej úrovni abstrakcie.

Klasifikácia podľa prostredia trvalého úložiska:

  • 1. V sekundárnej pamäti alebo konvenčnej (angl. konvenčná databáza) - perzistentné pamäťové médium je periférna energeticky nezávislá pamäť (sekundárna pamäť), zvyčajne pevný disk.
  • 2. DBMS umiestňuje do pamäte RAM iba vyrovnávaciu pamäť a údaje na aktuálne spracovanie;
  • 3. V Náhodný vstup do pamäťe(Anglická databáza v pamäti, databáza rezidentná v pamäti, databáza hlavnej pamäte) - všetky údaje vo fáze vykonávania sú v RAM;
  • 4. v terciárnej pamäti(anglická terciárna databáza) - perzistentné pamäťové médium je veľkokapacitné pamäťové zariadenie (terciárna pamäť) oddelené od servera, zvyčajne založené na magnetických páskach alebo optických diskoch. Sekundárna pamäť servera ukladá iba dátový adresár terciárnej pamäte, vyrovnávaciu pamäť súborov a dáta pre aktuálne spracovanie; samotné načítanie údajov vyžaduje špeciálny postup.

Klasifikácia obsahu:

  • 1. Geografický;
  • 2. Historický;
  • 3. vedecké;
  • 4. Multimédiá;
  • 5. Klient.

Klasifikácia podľa stupňa distribúcie:

  • 1. Centralizovaná, alebo koncentrovaná (anglická centralizovaná databáza): databáza, ktorá je plne podporovaná na jednom počítači.
  • 2. Distribuovaná (angl. distribuovaná databáza): databáza, ktorej komponenty sú podľa nejakého kritéria umiestnené v rôznych uzloch počítačovej siete.
  • 3. Heterogénna distribuovaná databáza: fragmenty distribuovanej databázy v rôznych sieťových uzloch sú podporované prostredníctvom viac ako jedného DBMS
  • 4. Homogénna distribuovaná databáza: fragmenty distribuovanej databázy v rôznych sieťových uzloch sú podporované pomocou rovnakého DBMS.
  • 5. Fragmentovaná, alebo delená (anglická partitioned database): metóda distribúcie údajov je fragmentácia (partitioning, partitioning), vertikálna alebo horizontálna.
  • 6. Replikovaná databáza: Metódou distribúcie údajov je replikácia.

Klasifikácia podľa technológie spracovania databázy

  • 1. Centralizovaná základňa údajov- uložený v pamäti jedného počítačového systému. Ak je tento výpočtový systém súčasťou počítačovej siete, je možný distribuovaný prístup k takejto databáze. Tento spôsob využitia databáz sa často používa v PC lokálnych sieťach;
  • 2. Distribuovaná databáza- pozostáva z niekoľkých, prípadne sa pretínajúcich alebo dokonca duplikujúcich častí uložených v rôznych počítačoch počítačovej siete. Práca s takouto databázou sa vykonáva pomocou distribuovaného systému správy databáz (RDBMS).

Klasifikácia podľa prístupu k údajom databázy:

  • 1. Databázy s lokálnym prístupom;
  • 2. databázy so vzdialeným (sieťovým) prístupom - centralizované databázové systémy so sieťovým prístupom navrhujú rôzne architektúry takýchto systémov:
    • * súborový server;
    • * Klientsky server.

Súborový server. Architektúra databázových systémov so sieťovým prístupom predpokladá pridelenie jedného zo sieťových strojov ako centrálneho (server, súbory). Na takomto stroji je uložená zdieľaná centralizovaná databáza. Všetky ostatné stroje v sieti fungujú ako pracovné stanice, ktoré podporujú užívateľský systémový prístup k centralizovanej databáze. Databázové súbory sa podľa požiadaviek používateľov prenášajú na pracovné stanice, kde sa hlavne spracúvajú. Pri vysokej intenzite prístupu k rovnakým údajom klesá výkon informačného systému. Používatelia môžu tiež vytvárať lokálne databázy na pracovných staniciach, ktoré výhradne používajú.

Klientsky server. Tento koncept znamená, že okrem ukladania centralizovanej databázy by mal byť centrálny stroj (databázový server) schopný vykonávať väčšinu spracovania údajov. Žiadosť o údaje zadaná klientom (pracovnou stanicou) generuje vyhľadávanie a získavanie údajov na serveri. Získané údaje (ale nie súbory) sa prenesú cez sieť zo servera ku klientovi. Špecifikom architektúry klient-server je použitie dotazovacieho jazyka SOL.

Klasifikácia podľa oblastí použitia:

1. Dokumentárne a dokumentografické databázy – obsahujú popisy dokumentov. V závislosti od obsahu popisu existujú dokumentografické databázy typov BO (len bibliografický popis dokumentu), BC (bibliografický popis a kľúčové slová) a BKR (bibliografický popis, kľúčové slová, abstrakt alebo abstrakt). Objavili sa aj plnotextové databázy, ktoré obsahujú plné texty dokumentov, ktoré sú v skutočnosti dokumentárne.

Dokumentografické systémy sú spravidla postavené podľa dvojslučkovej schémy: prvá slučka obsahuje dokumentografickú databázu a používa sa na automatizované vyhľadávanie dokumentov, druhá slučka v prípade potreby zabezpečuje vydanie úplného textu dokumentu v forma kópie pôvodného zdroja na papier, mikrofilm alebo zobrazenie textu na obrazovke z optického disku (v niektorých prípadoch z vysokokapacitného pevného disku).

Táto trieda zahŕňa nasledujúce typy databáz:

  • - podľa publikovaných vedeckých a technických dokumentov;
  • - podľa publikovaných dokumentov z oblasti spoločenských vied;
  • - podľa patentových dokumentov;
  • - podľa správ o R&D, R&D, software;
  • - na základe materiálov medzisektorovej výmeny (vedecko-technické úspechy, FPTO, IL, katalóg, informácie o výstavách atď.);
  • - podľa noriem a inej regulačnej a technickej dokumentácie;
  • - bibliografické databázy vytvorené v knižniciach, knižných vydavateľstvách a predajniach kníh;
  • - abstraktné a plnotextové databázy spoločensko-politických informácií vytvárané masmédiami;
  • - databáza legislatívnych a právnych informácií;
  • - dokumentografický dokumentografický softvér špeciálne typy Dokumenty;
  • - Databáza archívnych dokumentov. Analýza stavu DBD rôznych typov v krajine ukazuje, že v súčasnosti zaznamenalo najväčší rozvoj DBD dokumentografického typu, najmä podľa publikovaných dokumentov v oblasti vedecko-technických informácií, spoločenských vied, patentových dokumentov. , správy o VaV, VaV a iných typoch dokumentov vytvorených v rámci systému vedecko-technických informácií.
  • 2. Produktový databázový systém – Produktové informácie sú hlavným typom technických a ekonomických informácií. Údaje o produkte sa vyznačujú:
    • - obrovská a často neusporiadaná nomenklatúra (od 10 miliónov do 1 miliardy položiek), len OKP obsahuje 25 miliónov pozícií, systém ekonomiky ťahania má až 16 miliónov spojovacích prvkov, sú tam informácie o viac ako 6 miliónoch chemických zlúčenín atď.;
    • - heterogenita a všestrannosť použitia a popisu produktu vo všetkých fázach jeho životného cyklu;
    • - množstvo vlastností (vlastností), ktoré charakterizujú jednotlivé skupiny produktov (do 200 vlastností);
    • - rôzne oblasti použitia produktov, ktoré pokrývajú všetky oblasti hospodárskej činnosti;
    • - početné a rôznorodé prepojenia medzi produktmi a inými typmi informácií (komunikácia s vývojármi a výrobcami, komponenty, suroviny a zdroje, technologických procesov, práce a služby, stav životné prostredie a tak ďalej.);
    • - veľký počet a rôznorodosť kategórií užívateľských skupín;
    • - prítomnosť veľkého množstva rôznych a nesúvisiacich systémov na klasifikáciu a kódovanie produktov (OKP, ESKD, ETNVT, harmonizovaný systém na opis a kódovanie tovaru, systém čiarových kódov, priemyselné a miestne systémy atď.);

Počet používateľov produktového databázového systému dosahuje desiatky tisíc (podniky priemyslu a poľnohospodárstvo viac ako 100 tisíc, riadiace a výkonné orgány - viac ako 50 tisíc, družstvá, požičovne a jednotlivé podniky atď.).

3. Ekonomické a trhové informácie - vytváranie databáz a bánk ekonomických a trhových informácií je dôležitým faktorom fungovania spoločnosti pri prechode na regulovanú trhovú ekonomiku.

V predchádzajúcich rokoch boli vytvorené a prevádzkované ekonomické databázy ako súčasť ASPR Štátneho plánovacieho výboru ZSSR, ESIS Goskomstatu Ruska, ASFR Ministerstva financií Ruska, ACS ZSSR Gossnab, OASU z r. Štátna banka, ostatné ministerstvá a rezorty, orgány územného riadenia podnikov a organizácií.

Rozvoj informačnej podpory pre regulované trhové hospodárstvo bude vychádzať z 2 hlavných faktorov:

  • - zníženie objemu výkazníckych údajov predkladaných podnikmi a organizáciami riadiacim orgánom a štátnej štatistike.
  • - výrazné zvýšenie informačných potrieb Rady federácie, podnikov, organizácií, obyvateľstva, orgánov územného a medzisektorového riadenia v oblasti sociálno-ekonomických informácií.

Hlavným smerom vo vývoji databázy sociálno-ekonomických a trhových informácií je vytvorenie nasledujúcich integrovaných databáz:

1) registre a databázy účtovných a štatistických jednotiek:

a. pasporty sociálno-ekonomického rozvoja administratívno-územných celkov (subjektov federácie, samosprávnych orgánov)

b. štrukturálne ekonomické jednotky vo všetkých odvetviach hospodárstva bez ohľadu na druh vlastníctva, najmä registre priemyselných, poľnohospodárskych, stavebných podnikov, vedeckých a projekčných organizácií, fariem a pod.;

c. stavebné registre.

  • 2) integrované databázy pre komplexnú analýzu stavu a vývoja ekonomických sektorov.
  • 3) Databáza ročných uzávierok činností, podnikov, organizácií a ich združení, území a regiónov.
  • 4) Databáza hromadných sčítaní, jednorazových sčítaní a výberových zisťovaní.
  • 5) Databáza bankových prevodov.
  • 6) DB o príjmoch a výdavkoch obyvateľstva vrátane DB o rodinných rozpočtoch.
  • 4. Faktické sociálne databázy – sociálne údaje sa týkajú údajov o populácii a sociálnom prostredí. Informácie o obyvateľstve zahŕňajú rodové, sociálne, zdravotné a akékoľvek iné osobné údaje o jednotlivcoch, ako aj súhrnné údaje o obyvateľstve krajiny ako celku a jej jednotlivých území a o určitých skupinách obyvateľstva: dôchodcovia, nájomníci, škola -vek deti, ženy atď.

Informácie o sociálnom prostredí zahŕňajú údaje o voľných pracovných miestach, urbanistickom plánovaní, mestskej ekonomike, mestskej osobnej doprave, zákonoch, priestupkoch verejný poriadok atď.

Prevažná väčšina sociálnych databáz je generovaná v rámci miestnych vládnych systémov. Zdrojom takýchto údajov sú spravidla formalizované dokumenty.

Spotrebiteľmi sociálnych databáz je obyvateľstvo, štátne orgány rôznych úrovní a sfér, od úradov a rezortov bytovej údržby až po Federálne zhromaždenie, ako aj vedci.

5. Databázy dopravných systémov krajiny - cieľom návrhu databázovej siete je posúdiť jej súčasný stav.

Ako súčasť určité typy doprava a ich automatizované riadiace systémy boli vytvorené a fungujú ako samostatné databázy a databanky, ako aj výkonné informačné systémy.

V leteckej doprave funguje počítačová sieť Sirena, ktorá automatizuje predaj leteniek. Sieť sa rozvíja a mala by pokrývať celé územie krajiny.

V železničnej doprave sa vytvoril expresný systém. Medzi jeho funkcie patrí nielen rezervácia a predaj železničných lístkov, ale aj vydávanie potvrdení o dostupnosti miest.

O námornej doprave v rámci systémov na vyhľadávanie informácií „Lodné spoločnosti“, „Prístavy“, „Zariadenia na opravu lodí“. "Lode" prevádzkujú databázy na plánovanie a reguláciu prevádzky flotily a prístavov, databázy na technický stav flotila.

V cestnej doprave sú v rámci informačných systémov využívané ako dokumentografické databázy ASNTI, "Vynálezy", "Normy", "Normy", "Smernice", tak aj faktografické databázy - "Garo", "Motorová doprava", "Nelikvidné aktíva" , "Ekonomika", "Stavebníctvo".

  • 6. Referenčné bázy pre obyvateľstvo a organizácie - vo vyspelých krajinách je zaužívaná prax využívania databázy pre informačné a referenčné služby pre obyvateľstvo a inštitúcie. Na tento účel sa organizuje prístup do databázy leteckých dopravcov s cieľom vydávať osvedčenia, napríklad o cestovnom poriadku lietadiel a vlakov; o adresách a telefónoch občanov a organizácií; o rozhlasových a televíznych programoch; o konaní výstav a pod. Okrem toho sa vytvárajú špeciálne informačné a referenčné databázy, medzi ktorými možno rozlíšiť tieto typy:
    • - encyklopédie a príručky;
    • - indexy firiem, podnikov a organizácií;
    • - biografické údaje ("Kto je kto");
    • - popisy nových druhov spotrebného tovaru;
    • - indexy štátnych zákaziek, dotácií a pod.

U nás je tento typ databáz v súčasnosti vyvíjaný veľkými referenčnými službami, ktoré poskytujú podobné služby, najmä s využitím manuálnych alebo automatizovaných kartoték. Niektoré typy referenčných BND chýbajú.

7. Zdrojový databázový systém - problémy prírodné zdroje zaujímajú osobitné miesto vo vývoji každého štátu a určujú stupeň jeho nezávislosti a prosperity.

Úplná a spoľahlivá informovanosť v tejto oblasti s cieľom kontrolovať, analyzovať a predpovedať stav zdrojov je jednou z prioritných potrieb v záujme objektívneho, vedecky podloženého hodnotenia možných ciest rozvoja spoločnosti.

Databázový systém prírodných zdrojov má množstvo funkcií vrátane:

  • - rôzne typy objektov databázových zdrojov;
  • - vzájomná závislosť a zameniteľnosť rôznych druhov zdrojov, a teda potreba zabezpečiť informačnú prepojenosť a porovnateľnosť informácií o nich;
  • - existencia veľkého počtu centralizovaných, ako aj regionálnych a rezortných zdrojov informácií;
  • - rôzne formy prezentácie informácií v informačných tokoch (digitálne, textové, grafické, kartografické a pod.);
  • - široký rozsah objemov a časových parametrov informačných tokov získaných pomocou senzorov aj manuálneho zadávania;
  • - vplyv stavu zdrojov a životného prostredia jedného regiónu na ostatné.
  • 8. Faktické základne a banky vedeckých údajov- moderná scéna Pre rozvoj vedy je charakteristický prechod na kvalitatívne novú úroveň výskumu, ktorý je determinovaný rozšíreným využívaním metód a prostriedkov informatiky – vedy o zákonitostiach a metódach akumulácie, spracovania a prenosu informácií. Aplikácia metód a prostriedkov informatiky má vo vede nielen oslobodiť výskumníka od rutinnej práce pri hľadaní a príprave na použitie známych informácií, ale aj zabezpečiť implementáciu jedinej línie matematickej technológie na riešenie problémov – od formulovanie matematických modelov a ich kompletná informačná podpora so všetkými potrebnými údajmi k tvorbe softvérových komplexov a realizácii riešenia úloh. Je dôležité, aby táto linka bola kontinuálna a prevádzkyschopná, bez technologických medzier v spracovaní dát. V podstate je to determinované rozhodujúcou transformáciou nesúrodých informácií, samostatných dátových súborov a jednotlivých programov do jedného informačného a softvérového produktu, ako aj komplexnou aplikáciou moderných metód manipulácie s takýmito produktmi pomocou výpočtovej techniky.
  • 9. Databázy v oblasti kultúry a umenia - databázy pre automatizáciu lexikografie môžu mať výrazný ekonomický efekt, ak je LDB integrovaná s automatizovanými publikačnými systémami, ktoré má v zahraničí hromadná aplikácia. Treba si uvedomiť, že databázy všetkých troch typov sa z hľadiska zloženia údajov výrazne prelínajú, hoci majú mnoho špecifických vlastností. Mnohé databázy sú zároveň pomerne veľké (až státisíce a dokonca milióny záznamov), takže ich vytvorenie a údržba si vyžaduje značné finančné prostriedky a prácu.
  • 10. Lingvistické databázy- Lingvistické databázy (LDB) obsahujú údaje o jazykových jednotkách rôznych úrovní (od morfémy po text) a rôzne informácie o týchto jednotkách.

LDB majú tri hlavné oblasti použitia:

  • - zabezpečenie fungovania rôznych automatizované systémy súvisiace so spracovaním textu a reči (informačné, expertné, školiace systémy, systémy na analýzu reči, strojový preklad atď.);
  • - automatizácia lexikografických činností pre masové a špeciálne účely, t.j. príprava slovníkov rôzne druhy(školiace, prekladateľské, normatívne, vysvetľujúce atď.);
  • - automatizácia práce výskumníkov: lingvistov, učiteľov jazykov a iných filológov.

informácie o ukladaní databázy

TÉMA 2 KLASIFIKÁCIA BND

Študované problémy:

1. Klasifikácia databázy

2. Klasifikácia DBMS

Literatúra:, kapitola 1, kapitola 2, kapitola 3.

BND sú komplexné systémy a ich klasifikáciu je možné vykonať ako pre celú BND ako celok, tak aj pre každú jej zložku samostatne. Klasifikácia pre každý komponent môže byť vykonaná podľa mnohých rôznych funkcií.

1. Klasifikácia databázy

1) Podľa formy prezentácie informácií rozlišovať vizuálny A audio systémy, ako aj systémy multimédiá. Táto klasifikácia zobrazuje formu, v akej sú informácie uložené v databáze a vydávané používateľom: vo forme obrázkov (znakový text, obrázky, kresby, fotografie atď.), zvuku alebo je možné použiť rôzne formy zobrazenia. informácie.

2) Podľa povahy organizácie údajov Databázu je možné rozdeliť na neštruktúrovaný(databáza vo forme sémantických sietí), čiastočne štruktúrované(napr. databázy s jednoduchým textom alebo hypertextové systémy) a štruktúrovaný(vyžadujú predbežný návrh a popis štruktúry databázy, až potom sa môžu naplniť údajmi). Tento atribút sa vzťahuje na informácie prezentované v symbolickej forme.

3) Štruktúrovaná databáza podľa typu použitého modelu údajov sa delia na hierarchické, siete, vzťahový, zmiešané A multi-model. Rozvoj technológií spracovania údajov viedol k vzniku porelačný, objektový alebo Hybrid , objektovo orientovaný , viacrozmerný DB.

4) Podľa typu uložených informácií Databáza je rozdelená na dokumentárnych filmov A lexikografický. Medzi dokumentárnymi základmi sú bibliografický, abstraktné A plné znenie.

TO lexikografický Databázy obsahujú rôzne slovníky, klasifikátory, nadpisy atď. Zvyčajne sa používajú ako referenčné spolu s dokumentačnými alebo faktografickými databázami.

IN dokumentárny Jednotkou uloženia v databáze je dokument ( Napríklad, text zákona alebo článku). Vyhľadávanie a vydávanie dokladov prebieha podľa ich obsahu. Najjednoduchšia metóda vyhľadávania je založená na použití deskriptory Kľúčové slová z problémovej oblasti, ktoré charakterizujú obsah dokumentu. Ich kolekcia získaná z požiadavky sa porovná s deskriptormi dokumentov ("vyhľadávací vzor"). Ako odpoveď na žiadosť používateľa sa vydá buď odkaz na dokument alebo samotný dokument, v ktorom môže nájsť informácie, ktoré ho zaujímajú.

V systémoch faktické typu, databáza ukladá informácie o objektoch predmetnej oblasti, ktoré sú pre používateľa zaujímavé, vo forme „faktov“ ( Napríklad, biografické údaje o zamestnancoch, údaje o produkcii produktov podľa výrobcov a pod.). V reakcii na požiadavku používateľa sa zobrazia ním požadované informácie alebo správa, že požadované informácie nie sú v databáze.

5) Podľa povahy organizácie ukladania údajov a prístupu k nim rozlišovať miestne A distribuované DB.

Lokálna databáza je databáza navrhnutá na používanie jedným používateľom. Lokálne databázy môže vytvárať každý užívateľ nezávisle, alebo ich možno získať zo zdieľanej databázy.

Distribuované DB navrhnúť možnosť súčasného prístupu viacerých používateľov k rovnakým informáciám (multi-užívateľský, paralelný prístupový režim). Fyzicky môžu byť rôzne časti databázy umiestnené na rôznych počítačoch, no logicky z pohľadu používateľa musia byť jedným celkom.

2. Klasifikácia DBMS

1) Podľa jazyka komunikácie DBMS sa delia na OTVORENÉ(používajte univerzálne programovacie jazyky), ZATVORENÉ(vlastné jazyky komunikácie s používateľmi) a zmiešané.

2) Podľa funkcie DBMS sa delia na informačný A operačné sály. Informácie DBMS umožňujú organizovať ukladanie informácií a prístup k nim. Operačný DBMS vykonávať zložité spracovanie Napríklad, automaticky umožňujú získať agregované ukazovatele, ktoré nie sú uložené priamo v databáze atď.

3) Podľa rozsahu možnej aplikácie rozlišovať univerzálny A špecializovaný, DBMS špecifické pre doménu(mať silné výrazové prostriedky na modelovanie zložitých objektov).

4) Podľa "moci" DBMS sa delia na pracovnej plochy A firemné. charakteristické znaky desktop DBMS sú relatívne nízke požiadavky na technické prostriedky, zameranie na konečného užívateľa, nízka cena.

Firemné DBMS poskytujú prácu v distribuovanom prostredí, vysoký výkon, podporu pre spoluprácu pri návrhu systému, majú pokročilé nástroje na správu a širšie možnosti na udržanie integrity. Tieto systémy sú zložité, drahé a vyžadujú značné výpočtové zdroje.

Tabuľka 2.1 - Najpopulárnejšie desktopové DBMS

DBMS

Výrobca

Vizuálna dBase

dBase Inc.

Paradox

corel

Microsoft Access

Microsoft

Microsoft FoxPro

Microsoft

Microsoft Data Engine

Microsoft

Tabuľka 2.2 - Server DBMS

DBMS

Výrobca

Oracle

Oracle Corp.

Microsoft SQL Server

Microsoft

Informix

Informix

Sybase

Sybase

5) Zameraním sa na prevažujúcu kategóriu používateľov DBMS je možné rozlíšiť pre vývojárov A pre koncových užívateľov.

Systémy orientované na vývojárov , musieť:

¾ mať kvalitné kompilátory;

¾ umožniť vytváranie „odcudziteľných“ softvérových produktov;

¾ mať pokročilé nástroje na ladenie;

¾ zahŕňajú nástroje projektovej dokumentácie;

¾ majú schopnosť vytvárať efektívne komplexné systémy.

Hlavná požiadavky prezentované na systémy koncových používateľov, sú:

¾ pohodlie rozhrania;

¾ vysoká úroveň jazykových prostriedkov;

¾ dostupnosť modulov inteligentných rád;

¾ zvýšená ochrana proti neúmyselným chybám (“spoľahlivá”) atď.

3. Klasifikácia databáz

1) Podmienky služby rozlišovať medzi bezplatným a plateným. Platené sa delia na komerčné a neziskové.

Nezisková databáza fungujú na princípe sebestačnosti a nekladú si za cieľ zisk (vedecký, knižničný alebo spoločensky významný C&D).

Hlavným účelom tvorby komerčná BND je profitovať z informačných aktivít.

2) Podľa formy vlastníctva BND sa delia na štátne a neštátne (súkromné, skupinové, osobné).

3) Podľa stupňa prístupnosti rozlišovať medzi verejným a obmedzeným prístupom .

4) Podľa pokrytia predmetnej oblasti BND možno klasifikovať do rôznych „sekcií“:

¾ územný (celosvetový, štát, mesto atď.);

¾ dočasné (rok, mesiac, od začiatku storočia atď.);

¾ rezortný ;

¾ problém ( tematické ) .

5) Podľa povahy interakcie používateľa BND sa delia na aktívne a pasívne. IN pasívna väzba vedúca úloha patrí používateľovi. IN aktívny Systém dokáže zmeniť správanie sám od seba.

6) Charakterom prevládajúceho spracovania informácií rozlišovať medzi systémami OLTP (On - Line Transaction Processing ) – online systémy na spracovanie transakcií(implementovať veľké množstvo pomerne jednoduchých dotazov) a OLAP - systémy (On - Line Analytical Processing ) – analytické systémy spracovania údajov(implementovať komplexné analytické spracovanie dát) príp systémy na podporu strategického rozhodovania (DSS).

Až do polovice 90. rokov dvadsiateho storočia. Databáza bola chápaná ako statické databázy ( OLTP ). Do polovice 90. rokov v triede DB OLTP nahromadilo sa toľko chronologických informácií, že objem databázy sa dramaticky zvýšil a výkon začal klesať. Napríklad, práca dekanátu si najčastejšie vyžaduje podrobné údaje o aktuálnom akademickom roku. Zároveň sú v databáze uložené aj retrospektívne údaje za predchádzajúce roky. Takéto údaje sú potrebné oveľa menej často a najčastejšie v agregovanej forme. Uveďte napríklad mená študentov, ktorí za posledné tri semestre dostali len výborné známky.

Tabuľka 2.3 - Porovnanie OLTP a OLAP

Charakteristický

OLTP

OLAP

Dominantné operácie

Zadávanie údajov, vyhľadávanie

Analýza dát

Povaha žiadostí

Veľa jednoduchých transakcií

Komplexné transakcie

Uložené dáta

funkčné, podrobné

Pokrývajúce veľké časové obdobie, agregované

Druh činnosti

Operatívna, taktická, nekomplikovaná manipulácia

Analytické, strategické: prognózovanie, modelovanie, analýza a identifikácia vzťahov, identifikácia štatistických vzorov

Dátový typ

Štruktúrovaný

heterogénne

Doba uchovávania údajov

Až rok

Až niekoľko desaťročí

Variabilita údajov

sa menia

Sú pridané

Objednávanie údajov

Pre akýkoľvek obor

Chronologicky

Množstvo spracovaných informácií

Malý

Veľmi veľký

Rýchlosť spracovania

Stredná

Veľmi vysoko

Často a v malých porciách

Zriedkavo a vo veľmi veľkých porciách

Oddelené databázy môžu kombinovať všetky údaje potrebné na vyriešenie jedného alebo viacerých aplikovaných problémov alebo údaje týkajúce sa akejkoľvek oblasti (napríklad financie, študenti, učitelia atď.). Tí prví sú zvyčajne tzv aplikované databázy a druhý - predmetové databázy (zodpovedajúce predmetom organizácie a nie jej informačným aplikáciám).

Predmetové databázy umožňujú poskytovať podporu pre akékoľvek súčasné a budúce aplikácie, keďže množina ich dátových prvkov zahŕňa množiny dátových prvkov aplikačných databáz. V dôsledku toho poskytujú predmetové databázy základňu pre spracovanie neformálnych, meniacich sa a neznámych dopytov a aplikácií (aplikácií, pre ktoré nie je možné vopred určiť požiadavky na údaje). Takáto flexibilita a adaptabilita umožňuje vytvárať pomerne stabilné informačné systémy založené na vecných databázach, t.j. systémy, kde je možné vykonať väčšinu zmien bez nutnosti prepisovania starých aplikácií.

Úvod

Kapitola 1. Základy databázy

1.1.Klasifikácia databáz

1.3 Modely popisu databázy

1.4. Základy desktopového DBMS

1.5.Požiadavky a normy na databázy

Kapitola 2. Práca s databázou Microsoft Access

2.1. Základy desktopovej databázy Microsoft Access

2.2. Práca s databázou Microsoft Access

Záver

Zoznam použitej literatúry

Úvod

Toky informácií, ktoré cirkulujú vo svete, ktorý nás obklopuje, sú obrovské. In

čas majú tendenciu sa zvyšovať. Preto v akejkoľvek organizácii

veľkých a malých, je tu problém takejto organizácie riadenia

údaje, ktoré by poskytovali čo najefektívnejšiu prevádzku. Niektorí

organizácie na to používajú kartotéky, ale väčšina ich uprednostňuje

počítačové metódy - databázy, ktoré umožňujú efektívne ukladať,

štruktúrovať a organizovať veľké množstvo údajov. A dnes bez báz

údajov si nemožno predstaviť prácu väčšiny finančných, priemyselných,

obchodné a iné organizácie. Ak by neexistovali databázy, jednoducho by sa zadusili

informačná lavína.

Existuje mnoho dobrých dôvodov na konverziu existujúcich informácií na počítačovú základňu. Teraz sú náklady na ukladanie informácií v počítačových súboroch lacnejšie ako na papieri. Databázy vám umožňujú ukladať, štruktúrovať informácie a získavať

optimálne pre užívateľa. Táto téma je v súčasnosti aktuálna, pretože. Využitím klient/server technológií možno ušetriť značné finančné prostriedky a hlavne čas na získanie potrebných informácií, ako aj zjednodušiť prístup a údržbu, keďže sú založené na komplexnom spracovaní dát a centralizácii ich úložiska. Okrem toho počítač umožňuje ukladať ľubovoľné dátové formáty, text, kresby, ručne písané dáta, fotografie, hlasové záznamy atď.

Aby bolo možné využiť také obrovské množstvo uložených informácií, popri vývoji

sú potrebné systémové zariadenia, prostriedky na prenos dát, pamäť, prostriedky

poskytovanie dialógu medzi človekom a počítačom, ktorý umožňuje užívateľovi vstúpiť

alebo robiť rozhodnutia na základe uložených údajov. Na poskytovanie týchto funkcií

boli vytvorené špecializované nástroje - systémy správy databáz (DBMS).

Účelom tejto práce je odhaliť koncept databázy a systému správy databáz, ako aj zvážiť prácu desktopového DBMS na konkrétnom príklade.

1.1.Klasifikácia databáz

Databáza je informačný model domény, súbor vzájomne prepojených údajov uložených spolu s minimálnou redundanciou, takže môže byť optimálne použitý pre jednu alebo viacero aplikácií. Dáta (súbory) sú uložené v externej pamäti a slúžia ako vstup pre riešenie problémov.

DBMS je program, ktorý implementuje centralizovanú správu dát uložených v databáze, prístup k nim a ich aktuálnosť.

Systémy správy databáz možno klasifikovať podľa spôsobu vytvárania vzťahov medzi údajmi, povahy funkcií, ktoré vykonávajú, rozsahu aplikácie, počtu podporovaných dátových modelov, povahy jazyka používaného na komunikáciu s databázou a ďalších parametre.

Klasifikácia DBMS:

· Podľa vykonávaných funkcií sa DBMS delia na prevádzkové a informačné;

· podľa rozsahu použitia sa DBMS delia na univerzálne a problémové;

· podľa použitého komunikačného jazyka sa DBMS delia na uzavreté, ktoré majú vlastné nezávislé jazyky pre používateľov na komunikáciu s databázami, a otvorené, v ktorých sa na komunikáciu používa programovací jazyk rozšírený o operátory jazyka manipulácie s údajmi s databázou;

· Podľa počtu podporovaných úrovní dátových modelov sú DBMS rozdelené na jedno-, dvoj-, trojúrovňové systémy;

· podľa spôsobu vytvárania väzieb medzi údajmi sa rozlišujú relačné, hierarchické a sieťové databázy;

· podľa spôsobu organizácie ukladania údajov a vykonávania funkcií spracovania sa databázy delia na centralizované a distribuované.

Centralizované databázové systémy so sieťovým prístupom predpokladajú dve hlavné architektúry – súborový server alebo klient-server.

Architektúra súborového servera. Predpokladá pridelenie jedného zo sieťových strojov ako centrálneho (hlavný súborový server), kde je uložená zdieľaná centralizovaná databáza. Všetky ostatné stroje fungujú ako pracovné stanice. Databázové súbory sa podľa požiadaviek užívateľov prenášajú na pracovné stanice, kde sa hlavne spracúvajú. Pri vysokej intenzite prístupu k rovnakým údajom klesá výkon informačného systému.

Architektúra klient-server. Tento model interakcie medzi počítačmi v sieti sa v skutočnosti stal štandardom pre moderné DBMS. Každý z počítačov pripojených k sieti a tvoriacich túto architektúru hrá svoju vlastnú úlohu: server vlastní a spravuje informačné zdroje systému, klient má možnosť ich využívať. Okrem uloženia centralizovanej databázy sa databázový server stará o väčšinu spracovania údajov. Žiadosť o údaje zadaná klientom (pracovnou stanicou) generuje vyhľadávanie a získavanie údajov na serveri. Extrahované dáta sú prenášané cez sieť zo servera ku klientovi. Špecifikom architektúry klient-server je použitie dotazovacieho jazyka SQL.

Databázový server je DBMS, ktorý súčasne spracováva požiadavky zo všetkých pracovných staníc. Klient a server sú spravidla od seba geograficky oddelené, v takom prípade tvoria distribuovaný systém spracovania dát.

1.2. Funkcionalita DBMS

Charakteristiky DBMS sú:

výkon;

Zabezpečenie integrity údajov na úrovni databázy;

Zabezpečenie bezpečnosti údajov;

Schopnosť pracovať v prostredí s viacerými používateľmi;

Možnosť importu a exportu dát;

Poskytovanie prístupu k údajom pomocou jazyka SQL;

Možnosť zadávať požiadavky

Dostupnosť nástrojov na vývoj aplikačných programov.

Výkon DBMS sa hodnotí:

Čas potrebný na dokončenie požiadaviek

rýchlosť získavania informácií;

čas importovania databáz z iných formátov;

rýchlosť operácií (ako je aktualizácia, vkladanie, mazanie);

čas generovania správy a ďalšie ukazovatele.

Bezpečnosť údajov je dosiahnutá:

Šifrovanie aplikačných programov;

šifrovanie údajov;

ochrana údajov pomocou hesla;

· obmedzenie prístupu k databáze (k tabuľke, do slovníka a pod.).

Zabezpečenie integrity údajov znamená existenciu prostriedkov, ktoré zabezpečia, že informácie v databáze zostanú vždy správne a úplné. Integrita údajov musí byť zachovaná bez ohľadu na to, ako sa údaje vkladajú do pamäte (online, prostredníctvom importu alebo prostredníctvom špeciálny program). V súčasnosti používané DBMS majú prostriedky na zabezpečenie integrity údajov a spoľahlivého zabezpečenia.

Systém správy databáz spravuje dáta v externej pamäti, poskytuje spoľahlivé ukladanie dát a podporu pre príslušné databázové jazyky. dôležitá funkcia DBMS je funkcia správy vyrovnávacej pamäte RAM. DBMS zvyčajne pracuje s databázami veľkých rozmerov, ktoré často presahujú veľkosť pamäte RAM počítača. Vyvinuté DBMS udržiavajú svoju vlastnú sadu vyrovnávacích pamätí RAM s vlastnou disciplínou na ich výmenu.

Najpoužívanejšie systémy na správu databáz sú Microsoft Access a Oracle.

Fázy práce v DBMS sú:

vytvorenie štruktúry databázy, t.j. definícia zoznamu polí, ktoré tvoria každý záznam tabuľky, typy a veľkosti polí (číselné, textové, logické atď.), definícia kľúčových polí na zabezpečenie potrebných väzieb medzi údajmi a tabuľkami;

Zadávanie a úprava údajov v databázových tabuľkách pomocou štandardného formulára prezentovaného štandardne vo forme tabuľky a pomocou obrazovkových formulárov špeciálne vytvorených používateľom;

spracovanie údajov obsiahnutých v tabuľkách na základe dopytov a na základe programu;

· výstup informácií z počítača s využitím reportov a bez použitia reportov.

Tieto fázy práce sa realizujú pomocou rôznych príkazov.

Centralizovaná databáza poskytuje ľahkú správu, lepšie využitie terénnych údajov pre vzdialené dotazy, vyššiu súbežnosť spracovania a nižšie náklady na spracovanie.

Distribuovaná databáza zahŕňa ukladanie a vykonávanie funkcií správy údajov v niekoľkých uzloch a prenos údajov medzi týmito uzlami v procese vykonávania dotazov. V takejto databáze môžu byť na rôznych počítačoch uložené nielen jej rôzne tabuľky, ale aj rôzne fragmenty jednej tabuľky. Zároveň je pre používateľa jedno, ako má dátové úložisko usporiadané, pracuje s takouto databázou ako s centralizovanou.

1.3 Modely popisu databázy

Existujú tri typy modelov popisu databázy – hierarchické, sieťové a relačné, pričom hlavným rozdielom medzi nimi je charakter popisu vzťahu a interakcie medzi objektmi a atribútmi databázy.

Hierarchický model zahŕňa použitie stromových štruktúr pozostávajúcich z určitého počtu úrovní na popis databázy. "Strom" je hierarchia prvkov nazývaných uzly. Prvky sa chápu ako zoznam, kolekcia, množina atribútov, prvky, ktoré popisujú objekty.

Príkladom jednoduchej hierarchickej štruktúry je administratívna štruktúra vysokej školy, ktorej prvky sú: „Univerzita – fakulta – skupina“. Na každej úrovni hierarchie danej štruktúry možno použiť rôzne atribúty. Atribúty tretej úrovne môžu byť napríklad: špecializácia skupiny, počet členov, priezvisko vedúceho skupiny a iné.

V tomto modeli sa nachádza koreňový uzol alebo jednoducho koreň – „Univerzita“, ktorý je na najvyššej úrovni hierarchie, a teda nad sebou nemá žiadne uzly. Každý uzol modelu má iba jeden zdroj, ktorý je vo vzťahu k nemu umiestnený o viac ako vysoký stupeň a na nasledujúcich úrovniach klasifikácie môže mať jeden, dva alebo viac uzlov, alebo ich nemá vôbec.

Princípy hierarchie:

· hierarchia vždy začína od koreňového vrcholu (alebo hlavného uzla);

Zdrojový uzol, z ktorého je strom zostavený, sa nazýva koreňový uzol alebo jednoducho koreň a jeden strom môže mať iba jeden koreň;

Uzol môže obsahovať jeden alebo viac atribútov, ktoré popisujú objekt v ňom;

generované uzly môžu byť vložené do „stromu“ v horizontálnom aj vertikálnom smere;

· Podriadené uzly sú prístupné iba cez zdrojový uzol, takže ku každému uzlu existuje len jedna prístupová cesta.

Výhodou modelu je jednoduchosť jeho konštrukcie, ľahké pochopenie podstaty princípu hierarchie, dostupnosť priemyselných DBMS, ktoré podporujú tento model. Nevýhodou je zložitosť operácií pri zaraďovaní informácií o nových databázových objektoch do hierarchie a odstraňovaní zastaraných informácií.

sieťový model popisuje elementárne dáta a vzťahy medzi nimi vo forme riadenej siete. Ide o také vzťahy medzi objektmi, keď každý podradený prvok má viac ako jeden zdrojový prvok a môže byť spojený s ktorýmkoľvek iným prvkom štruktúry. Napríklad v riadiacej štruktúre vzdelávacej inštitúcie môže mať detský prvok „Študent“ nie jeden, ale dva počiatočné prvky: „Študent - Študijná skupina“ a „Študent – ​​internátna izba“.

Sieťové štruktúry môžu byť viacúrovňové a môžu mať rôzny stupeň zložitosti. Schéma, ktorá má aspoň jeden vzťah many-to-many a ktorej implementácia vyžaduje zložité metódy, je komplexná schéma.

Databáza opísaná sieťovým modelom pozostáva z oblastí, z ktorých každá pozostáva zo záznamov a tie zase z polí. Nevýhodou sieťového modelu je jeho komplexnosť, možnosť straty dátovej nezávislosti pri reorganizácii databázy. Ako prichádzajú noví používatelia, nové aplikácie a nové typy dotazov, databáza rastie a môže narušiť logický pohľad na údaje.

vzťahový model je založený na koncepte „vzťahu“ a jeho údaje sú tvorené vo forme tabuliek. Relácia je dvojrozmerná tabuľka, ktorá má svoj vlastný názov, v ktorej minimálnym objektom akcií zachovávajúcim jej štruktúru je riadok tabuľky (n-tice) pozostávajúci z buniek tabuľky – polí.

Každý stĺpec tabuľky zodpovedá iba jednej zložke tohto vzťahu. Z logického hľadiska je relačná databáza reprezentovaná množinou dvojrozmerných tabuliek rôzneho vecného obsahu.

Vzťahy relačných databáz sú v závislosti od obsahu objektívne a koherentné. Objektívne vzťahy uchovávajú údaje o akomkoľvek jednom objekte, inštancii entity. V nich jeden z atribútov jednoznačne identifikuje objekt a nazýva sa kľúčom vzťahu alebo primárnym atribútom (pre prehľadnosť je zapísaný v prvom stĺpci tabuľky). Zostávajúce atribúty sú funkčne závislé od tohto kľúča. Objektívne nemôžu existovať žiadne duplicitné objekty a to je hlavné obmedzenie relačnej databázy. Prepojený vzťah ukladá kľúče niekoľkých objektových vzťahov, podľa ktorých sa medzi nimi vytvárajú väzby.

Ak množina databázových atribútov nie je vopred stanovená, sú možné rôzne možnosti ich zoskupovania, bez ohľadu na zvolenú metódu však musia byť dodržané jednotné požiadavky. Najmä ak databáza obsahuje veľa vzťahov, potom by mali mať minimálnu redundanciu v reprezentácii informácií; atribúty zahrnuté v databáze musia zabezpečiť vykonávanie výpočtov hmotnosti; po pridaní nových atribútov do databázy by malo byť prebudovanie množín vzťahov minimálne.

Medzi výhody relačného modelu patrí: jednoduchosť konštrukcie, prístupnosť pochopenia, možnosť prevádzkovať databázu bez znalosti metód a metód jej konštrukcie, dátová nezávislosť, flexibilita štruktúry a iné. Nevýhody modelu sú: nízky výkon v porovnaní s hierarchickými a sieťovými modelmi, zložitosť softvér, nadbytok.

1.4. Desktop DBMS

Desktop DBMS sa líšia v tom, že používajú výpočtový model so sieťou a súborovým serverom (architektúra "súborový server"). Nárast zložitosti úloh, vznik osobných počítačov a lokálnych sietí boli predpokladmi pre vznik novej architektúry „súborového servera“. Táto sieťovo prístupná databázová architektúra predpokladá, že jeden z počítačov v sieti je určený ako vyhradený server, ktorý bude ukladať databázové súbory. V súlade s požiadavkami užívateľa sú súbory zo súborového servera prenášané na užívateľské pracovné stanice, kde prebieha hlavná časť spracovania dát. Centrálny server v podstate plní len úlohu úložiska súborov, nezúčastňuje sa na samotnom spracovaní údajov.

Práca je štruktúrovaná takto:

Databáza vo forme sady súborov je umiestnená na pevnom disku dedikovaného počítača (súborového servera). Existuje lokálnej sieti, pozostávajúci z klientskych počítačov, na každom z nich je nainštalovaná DBMS a aplikácia na prácu s databázou. Na každom z klientskych počítačov majú používatelia možnosť spustiť aplikáciu. Pomocou používateľského rozhrania poskytovaného aplikáciou iniciuje požiadavku do databázy na získanie/aktualizáciu informácií.

Všetky volania do databázy prechádzajú cez DBMS, ktorá v sebe zapuzdruje všetky informácie o fyzickej štruktúre databázy umiestnenej na súborovom serveri. DBMS iniciuje volania na údaje umiestnené na súborovom serveri, v dôsledku čoho sa časť databázových súborov skopíruje na klientsky počítač a spracuje, čím sa zabezpečí vykonanie požiadaviek používateľov (s údajmi sa vykonajú potrebné operácie). V prípade potreby (v prípade zmeny údajov) sú údaje odoslané späť na súborový server za účelom aktualizácie databázy. DBMS vráti výsledok do aplikácie. Aplikácia pomocou používateľského rozhrania zobrazí výsledok vykonania dotazu. V rámci architektúry „file-server“ vznikli prvé verzie obľúbeného tzv. desktop DBMS ako dBase a Microsoft Access.

Uvádzajú sa nasledujúce hlavné nevýhody tejto architektúry: keď veľa používateľov pristupuje k rovnakým údajom súčasne, výkon prudko klesá, pretože je potrebné počkať, kým používateľ pracujúci s údajmi svoju prácu dokončí. V opačnom prípade môžu byť zmeny vykonané niektorými používateľmi prepísané zmenami vykonanými inými používateľmi.

K dnešnému dňu sú známe viac ako dve desiatky dátových formátov pre desktopové DBMS, ale najpopulárnejšie sú podľa počtu predaných kópií dBase, Paradox, FoxPro a Access. Z nedávno objavených DBMS je potrebné poznamenať aj Microsoft Data Engine - v podstate server DBMS, ktorý je<облегченную>verzia Microsoft SQL Server, ale určená predovšetkým pre stolné počítače a malé pracovné skupiny.

Výrobca

http://www.dbase2000.com/

http://www.corel.com/

Microsoft Access 2000

http://www.microsoft.com/

Microsoft FoxPro

http://www.microsoft.com/

Microsoft Visual FoxPro

http://www.microsoft.com/

Microsoft Visual FoxPro

http://www.microsoft.com/

Microsoft Data Engine

http://www.microsoft.com/

1.5.Požiadavky a normy na databázy

Na moderné databázy, a teda aj na DBMS, na ktorých sú postavené, sa kladú tieto základné požiadavky:

· Vysoký výkon (krátky čas odozvy na požiadavku).

Ak chcete vytvoriť novú databázu pomocou sprievodcu, postupujte takto:

Spustite príkaz Súbor [Vytvoriť]

V dialógovom okne „Vytvoriť“, ktoré sa otvorí, vyberte skratku „Databázy“. Na obrazovke sa zobrazí zoznam databáz, ktoré sprievodca ponúka. Tento zoznam je veľmi rozsiahly a môže dosahovať niekoľko desiatok rôznych možností, ktoré je možné okamžite použiť alebo poslúžia ako základ pre budovanie ďalších databáz. Napríklad „Pracovné príkazy“, „Faktúry“, „Kontakty“, „Udalosti“, … atď.

Vyberte si zo zoznamu vzorovú databázu, ktorá vám vyhovuje, a kliknutím na tlačidlo OK spustite sprievodcu vytvorením databázy.

V dialógovom okne „Nový databázový súbor“, ktoré sa otvorí, z rozbaľovacieho zoznamu Priečinok vyberte priečinok, do ktorého chcete uložiť vytvorenú databázu, a do poľa Názov súboru zadajte jeho názov. Potom kliknite na tlačidlo Vytvoriť.

V ďalšom dialógovom okne vám sprievodca povie, aké informácie bude obsahovať databáza, ktorú vytvorí. V spodnej časti tohto dialógového okna sú nasledujúce tlačidlá:

Zrušiť - ukončí sprievodcu;

Späť - umožňuje vrátiť sa na predchádzajúci krok v sprievodcovi;

Hotovo - spustí sprievodcu vytvorením databázy s vybranými možnosťami a pred stlačením tohto tlačidla sa zobrazia informácie, ktoré budú uložené v databáze.

Dialógové okno, ktoré sa otvorí, obsahuje dva zoznamy. Prvým je zoznam databázových tabuliek a druhým zoznam polí vo vybranej tabuľke. Tento zoznam označuje polia, ktoré budú zahrnuté v tabuľke. Zvyčajne sú označené takmer všetky polia tabuliek, s výnimkou polí, ktoré sa používajú pomerne zriedka. Začiarknutím alebo zrušením začiarknutia polí môžete vybrať polia tabuľky. Po výbere polí tabuľky kliknite na tlačidlo Ďalej.

V nasledujúcom dialógovom okne vyberte typ dizajnu obrazovky z navrhovaných ukážok a kliknite na tlačidlo Ďalej (v tomto prípade vám obrazovka ponúka možnosť náhľadu typov dizajnu obrazovky, ktoré si môžete vybrať v pravom okne dialógového okna) .

V ďalšom kroku sprievodcu môžete definovať typ správ generovaných pre databázu. Po výbere zobrazenia, ktoré vám vyhovuje, kliknite na tlačidlo Ďalej (tu ste tiež vyzvaní, aby ste sa oboznámili s možné možnosti, ktorý je možné aj opakovať).

Dialógové okno sprievodcu vytvorením databázy, ktoré sa otvorí, vám umožňuje zadať jej názov a obrázok (napríklad ochrannú známku spoločnosti), ktoré sa zobrazia vo všetkých zostavách. Ak sa rozhodnete použiť obrázok, začiarknite políčko Áno. V tomto prípade sa sprístupní tlačidlo Obrázok, kliknutím naň sa otvorí dialógové okno „Vybrať obrázok“ na výber súboru s obrázkom, ktorý ste predtým vytvorili. Kliknutím na tlačidlo Ďalej vykonáte ďalšie nastavenia.

Kliknutím na tlačidlo Dokončiť posledné okno dialógovom okne spustíte sprievodcu na vytvorenie databázy so zadanými parametrami. Pomocou tlačidla Späť sa môžete vrátiť na ktorýkoľvek z predchádzajúcich krokov a zmeniť nastavenia databázy. Môžete kliknúť na tlačidlo Dokončiť v ktoromkoľvek dialógovom okne sprievodcu a odmietnuť ďalšie nastavenie ďalších parametrov. V tomto prípade sprievodca pri svojej práci používa predvolené nastavenia.

Po kliknutí na tlačidlo Dokončiť sprievodca pristúpi k vytvoreniu databázy pozostávajúcej z tabuliek s poľami, ktoré určíte, jednoduchých formulárov na zadávanie a prezeranie informácií a jednoduchých správ. Po dokončení procesu vytvárania databázy môžete hotovú databázu ihneď používať: zadávať údaje do tabuliek, prezerať ich a tlačiť.

Ak vám možnosti navrhovaných databáz nevyhovujú, môžete vytvoriť prázdnu databázu a pridať do nej tabuľky, dotazy, formuláre a zostavy.

Začnete teda vytvárať databázové tabuľky, do ktorých sa následne budú zapisovať informácie. V budúcnosti je možné údaje v tabuľke doplniť o nové údaje, upraviť alebo z tabuľky vylúčiť. Údaje si môžete prezerať v tabuľkách alebo ich usporiadať podľa niektorých kritérií. Informácie obsiahnuté v tabuľkách možno použiť na generovanie správ. Okrem toho môžete graficky interpretovať informácie obsiahnuté v databáze. S riešením týchto problémov sa zoznámite v nasledujúcich kapitolách.

Vytvorenie tabuľky v MS Access sa vykonáva v okne databázy. Pri vytváraní tabuľky v novej databáze zvážte postupnosť svojich akcií:

Otvorte okno databázy, ktorú ste vytvorili, a prejdite na kartu „Tabuľky“.

Kliknite na tlačidlo Nový v okne databázy.

Otvorí sa dialógové okno „Nová tabuľka“, v pravej časti ktorého je zoznam možností pre ďalšiu prácu:

Tabuľkový režim - umožňuje vytvoriť novú tabuľku v tabuľkovom režime;

Konštruktor - umožňuje vytvoriť novú tabuľku v návrhári tabuliek;

Sprievodca tabuľkou - umožňuje vytvoriť novú tabuľku pomocou sprievodcu;

Importovať tabuľky – umožňuje importovať tabuľky z externého súboru do aktuálnej databázy;

Odkaz na tabuľky – umožňuje vytvárať tabuľky prepojené s tabuľkami z externých súborov.

Vyberte z tejto tabuľky možnosť vytvorenia tabuľky, ktorá vám vyhovuje, a kliknite na tlačidlo OK.

Vytvorte štruktúru tabuľky pomocou nástroja podľa vlastného výberu. Tabuľku môžete vytvoriť pomocou sprievodcu a pomocou návrhára.

Na priradenie tabuľky k informáciám, ktoré obsahuje, je každej tabuľke pridelený názov. V dialógovom okne Uložiť zadajte názov tabuľky a kliknite na tlačidlo OK.

Pri pomenovaní tabuľky, ako je názov databázy, nemusíte byť obmedzený na osem znakov. Názov tabuľky, podobne ako názvy iných databázových objektov, je uložený v samotnej databáze.

Názov poľa sa zadáva do vstupného poľa stĺpca názvu poľa. Pri pomenovávaní polí musíte dodržiavať nasledujúce pravidlá:

Názov poľa môže obsahovať až 64 znakov, ale túto možnosť by ste nemali zneužívať nastavovaním príliš dlhých názvov;

Názov poľa môže obsahovať písmená, čísla, medzery a špeciálne znaky, okrem bodky (.), výkričníka (!), zátvoriek () a niektorých riadiacich znakov (s kódmi ASCII 0-31);

Názov poľa nemôže začínať medzerou;

Dve polia v tej istej tabuľke nemôžu mať rovnaký názov;

Nedodržiavanie týchto pravidiel je monitorované pomocou MS Access DBMS, ale v niektorých prípadoch to môže viesť k ťažko odhaliteľným chybám, preto sa odporúča, aby ste dodržiavanie vyššie uvedených pravidiel nezávisle monitorovali pri praktickej práci.

Je vhodné pokúsiť sa použiť krátke názvy, aby sa dali ľahšie identifikovať pri prezeraní tabuliek.

Text;

číselné;

peňažné;

Počítadlo;

Dátum Čas;

logické;

Pole MEMO:

pole objektu OLE;

Majster suplovania.

Textové polia môžu obsahovať písmená, čísla a špeciálne znaky. Maximálna šírka poľa je 255 znakov.

Ak chcete zmeniť šírku poľa, v riadku Veľkosť poľa v časti „Vlastnosti poľa“ zadajte číslo, ktoré určuje šírku poľa (od 1 do 255).

Každý z dátových typov má svoje vlastnosti, ktoré sa zobrazujú v časti Vlastnosti poľa okna návrhára.

Keď sme si prezreli dátové typy v Accesse a jednotlivé vlastnosti polí tabuľky, môžeme začať vytvárať štruktúru tabuľky. Pozrime sa na vytvorenie štruktúry tabuľky pomocou príkladu vytvorenia tabuľky Objednávky v databáze Northwind, ktorá sa dodáva s Accessom. Táto tabuľka je už v databáze Northwind, ale bude veľmi užitočné pozrieť si proces vytvárania tejto tabuľky. Aby nedošlo k narušeniu štruktúry databázy Northwind, najprv vytvorte vzorovú databázu a otvorte jej okno.

V okne Návrh tabuľky v stĺpci Názov poľa zadajte Kód objednávky.

Stlačením klávesu Tab alebo Enter sa presuniete do stĺpca Typ údajov. Zároveň si všimnite, že informácie sa zobrazujú v časti „Vlastnosti poľa“ v spodnej časti dialógového okna.

Stĺpec Typ údajov má teraz hodnotu Text. Kliknite na tlačidlo rozbalenia na pravej strane obdĺžnika a zobrazí sa zoznam všetkých typov údajov. Z tohto zoznamu vyberte pomocou myši alebo klávesov hore a dole hodnotu počítadla a stlačením klávesu Tab sa presuňte do stĺpca Popis. Stĺpec Popis je vysvetlenie, ktoré dávate svojim poliam. Keď budete s touto tabuľkou v budúcnosti pracovať, tento popis sa zobrazí v spodnej časti obrazovky MS Access vždy, keď zadáte pole Kód objednávky a pripomenie vám účel tohto poľa.

Zadajte vysvetľujúci text do stĺpca Popis a stlačením klávesu Tab alebo Enter prejdite na zadávanie informácií o ďalšom poli Rovnakým spôsobom zadajte popis pre všetky polia v tabuľke.

Vytvorte tabuľku v údajovom zobrazení

Zvažovali sme dva spôsoby vytvárania tabuliek, teraz prejdeme k tretiemu. Každá z metód má svoje výhody a nevýhody. Ale sme si istí, že tento spôsob tvorby stola vás ohromí svojou jednoduchosťou, prehľadnosťou a bude sa vám veľmi páčiť. Niet divu, že sa nachádza na prvom mieste v zozname metód vytvárania tabuliek v dialógovom okne Nová tabuľka. Pravdepodobne ho budete používať väčšinu času.

Nižšie je uvedená postupnosť akcií, ktoré musíte vykonať:

Prejdite na kartu "Tabuľky" v okne databázy a kliknite na tlačidlo Vytvoriť.

V dialógovom okne Nová tabuľka vyberte zo zoznamu možností Režim tabuľky a kliknite na OK. V dôsledku týchto akcií sa otvorí dialógové okno „Tabuľka“, ktoré obsahuje predvolene vytvorenú tabuľku. Táto tabuľka má 20 stĺpcov a 30 riadkov, čo vám na začiatok stačí. Po uložení tejto tabuľky môžete samozrejme pridať toľko riadkov a stĺpcov, koľko potrebujete.

Názvy polí tabuľky sú definované štandardne, ale je nepravdepodobné, že budú spĺňať vaše požiadavky. MS Access veľmi uľahčuje prideľovanie nových názvov polí. Ak to chcete urobiť, dvakrát kliknite na oblasť výberu prvého poľa (ktorého nadpis obsahuje pole 1). Názov poľa sa zvýrazní a zobrazí sa blikajúci kurzor. Zadajte názov prvého poľa a stlačte kláves Tab. Podobne zadajte zvyšok názvov polí tabuľky do nasledujúcich stĺpcov.

Teraz vyplňte niekoľko riadkov vašej tabuľky a zadajte informácie do formulára, do ktorého budú zadané v budúcnosti. Skúste všetko napísať rovnakým štýlom (ak ste si napríklad prvý dátum zapísali 14.10.2009, ďalší už nepíšte 3. novembra 2009). Ak MS Access nastaví nesprávny typ údajov, môžete ho zmeniť, ale je lepšie zadať všetko správne naraz.

Uložte tabuľku vykonaním príkazu Súbor/Uložiť rozloženie alebo kliknutím na tlačidlo Uložiť na paneli nástrojov. V dialógovom okne Uložiť, ktoré sa otvorí, zadajte názov tabuľky a kliknite na tlačidlo OK.

Keď sa zobrazí výzva na vytvorenie primárneho kľúča pre tabuľku, kliknite na tlačidlo Áno a MS Access vytvorí tabuľku odstránením nadbytočných riadkov a stĺpcov.

Teraz sa uistite, že Access vybral správne typy údajov pre každé pole. Ak to chcete urobiť, prejdite do okna návrhára tabuľky spustením príkazu View/Table Designer. Ak vám niečo v štruktúre tabuľky nevyhovuje, urobte potrebné zmeny.

V predchádzajúcej kapitole sme sa venovali použitiu filtrov a v tejto kapitole sa pozrieme na viac mocný nástroj výbery údajov - dopyty.

V praxi je často potrebné vybrať zo zdrojovej tabuľky časť záznamov, ktoré spĺňajú určité kritériá, a objednať výber. Kritériá môžu byť určené kombináciou viacerých podmienok. Napríklad potrebujete vybrať záznamy o dodávateľoch určitého produktu z Minska a zoradiť ich abecedne podľa názvu spoločnosti. Na vyriešenie takýchto problémov sú navrhnuté Sprievodca dotazom a Zostavovač dotazov, pomocou ktorých môžete:

Vytvárajte komplexné kritériá na výber záznamov z jednej alebo viacerých tabuliek;

Zadajte polia zobrazené pre vybraté záznamy;

Vykonajte výpočty s použitím vybraných údajov.

Čo je vzorová žiadosť?

Predtým sme sa zaoberali všeobecnými ustanoveniami týkajúcimi sa databáz, kde sme poznamenali, že jedným z hlavných účelov databáz je rýchle vyhľadávanie informácie a odpovede na rôzne otázky. Otázky formulované vo vzťahu k databáze sa nazývajú dotazy. MS Access používa na vytváranie dotazov nástroj na tvorbu dotazov a príkaz SELECT v programe MS Access.

Čo je to „žiadosť podľa vzoru“? Vzorový dotaz je interaktívny nástroj na výber údajov z jednej alebo viacerých tabuliek. Pri vytváraní dotazu musíte zadať kritériá na výber záznamov v zdrojovej tabuľke. V tomto prípade by ste namiesto písania viet v špeciálnom jazyku mali jednoducho vyplniť formulár žiadosti, ktorý sa nachádza v okne návrhára žiadosti. Spôsob generovania požiadavky vyplnením formulára sa dá ľahko naučiť a pochopiť. Prispieva k efektívnemu využívaniu možností MS Access užívateľmi, ktorí majú čo i len minimálne zručnosti v práci s aplikáciou alebo ju nemajú vôbec.

Všetky potrebné informácie sú v tabuľke Clients databázy Northwind. Ak chcete vytvoriť žiadosť, postupujte takto:

V okne databázy prejdite na kartu Dotazy a kliknite na tlačidlo Vytvoriť.

Poradie polí vo formulári dotazu určuje poradie, v ktorom sa zobrazia vo výslednej tabuľke. Ak chcete zmeniť umiestnenie poľa v tomto zozname, postupujte takto:

Umiestnite ukazovateľ myši na oblasť výberu stĺpca, ktorá sa nachádza priamo nad názvom poľa. Keď sa ukazovateľ zmení na šípku, kliknutím na tlačidlo zvýraznite stĺpec.

Kliknite a podržte tlačidlo myši v tejto polohe. Na konci ukazovateľa sa zobrazí obdĺžnik.

Posuňte stĺp v požadovanom smere. Hrubá zvislá čiara zobrazuje jeho aktuálnu polohu.

Keď je hrubá zvislá čiara na požadovanom mieste, tlačidlo uvoľnite. Pole sa presunie na nové miesto.

Presunutie stĺpca formulára dotazu. Niekedy nie je možné okamžite vybrať stĺpec na presun. Uistite sa, že ste klikli na oblasť výberu stĺpca (malý obdĺžnik, ktorý sa nachádza priamo nad názvom poľa). Toto je jediné miesto, kde môžete chytiť baliaci stĺp. Ak chcete preniesť pole do formulára žiadosti, dvakrát kliknite na názov poľa

Prečítajte si Auto Report.

V priebehu niekoľkých sekúnd sa na obrazovke zobrazí správa pripravená na použitie. Tento prehľad obsahuje všetky polia v tabuľke. Ich mená sú usporiadané vertikálne objem v rovnakom poradí, ako sú uvedené v tabuľke. Napravo od názvu každého poľa sa zobrazuje jeho hodnota v tabuľke.

Záver

V tomto ročníková práca bol uvažovaný koncept databázy a databázového manažérskeho systému, pomocou ktorého sa realizuje centralizovaná správa údajov uložených v databáze, prístup k nim a ich aktuálnosť. Databáza je teda súborom vzájomne súvisiacich údajov uložených spolu v jednom alebo viacerých počítačových súboroch. Zvažovala sa aj práca s jedným z populárnych DBMS Microsoft Access.

Databáza Microsoft Access poskytuje potrebné finančné prostriedky pracovať s databázami pre neskúseného užívateľa, čo mu umožňuje jednoducho a jednoducho vytvárať databázy, zadávať do nich informácie, spracovávať dotazy a generovať reporty. Bohužiaľ, vstavaný systém pomocníka nevysvetľuje začínajúcemu používateľovi jasne, ako pracovať, takže je potrebný manuál.


Marchenko A.P. Microsoft Access: Krátky kurz. - Petrohrad: Peter, 2005. - s. 56

Lazarev I.P.. „Microsoft Access for Dummies.“ Petrohrad – Peter, 2004. – s.139.

Lazarev I.P.. „Microsoft Access pre figuríny.“ Petrohrad – Peter, 2004. – s. 196.

Marchenko A.P. Microsoft Access: Krátky kurz. - Petrohrad: Peter, 2005. - 239.

Načítava...