ecosmak.ru

Класифікація бд за способом організації даних. Класифікація та характеристика баз даних

2.1. Визначення та поняття теорії баз даних

База даних (БД, database) - названа сукупність структурованих даних, що відносяться до певної предметної області.

Предметна область - деяка частина реально існуючої системи, що функціонує як самостійна одиниця.

Повна предметна область може бути економікою країни або групи союзних держав, проте на практиці для інформаційних систем найбільше значеннямає предметну область масштабу окремого підприємства чи корпорації.

Система управління базами даних (СУБД) — комплекс програмних та мовних засобів, необхідних для створення та модифікації бази даних, додавання, модифікації, видалення, пошуку та відбору інформації, подання інформації на екрані та в друкованому вигляді, розмежування прав доступу до інформації, виконання інших операцій із базою.

Реляційна БД – основний тип сучасних баз даних. Складається з таблиць, між якими можуть існувати зв'язки за ключовими значеннями.

Таблиця бази даних (table) - регулярна структура, що складається з однотипних рядків (записів, records), розбитих на стовпці (поля, fields).

Теоретично реляційних баз даних синонім таблиці — ставлення (relation), у якому рядок називається кортежем, а стовпець — атрибутом.

У концептуальній моделі реляційної БД аналогом таблиці є сутність (entity), з певним набором властивостей – атрибутів, здатних набувати певних значень (набір допустимих значень – домен).

Ключовий елемент таблиці (ключ, regular key) — таке її поле (простий ключ) чи рядкове вираз, утворене з значень кількох полів (складовий ключ), яким можна визначити значення інших полів для однієї чи кількох записів таблиці. На практиці для використання ключів створюються індекси - службова інформація, що містить упорядковані відомості про ключові значення. У реляційній теорії та концептуальній моделі поняття «ключ» застосовується для атрибутів відношення чи сутності.

Первинний ключ (primary key) - головний ключовий елемент, що однозначно ідентифікує рядок у таблиці. Можуть також існувати альтернативний (candidate key) та унікальний (unique key) ключі, що служать також для ідентифікації рядків таблиці.

У реляційній теорії первинний ключ - мінімальний набір атрибутів, що однозначно ідентифікує кортеж щодо.

У концептуальній моделі первинний ключ - мінімальний набір атрибутів сутності, що однозначно ідентифікує екземпляр сутності.

Зв'язок (relation) – функціональна залежність між об'єктами. У реляційних базах даних між таблицями встановлюються зв'язки за ключами, один з яких у головній (parent, батьківській) таблиці – первинний, другий – зовнішній ключ – у зовнішній (child, дочірній) таблиці, як правило, первинним не є і утворює зв'язок «один до багатьох» (1: N). У разі первинного зовнішнього ключа зв'язок між таблицями має тип один до одного (1:1). Інформація про зв'язки зберігається у базі даних.

Зовнішній ключ (foreign key) - ключовий елемент підлеглої (зовнішньої, дочірньої) таблиці, значення якого збігається зі значенням первинного ключа головної (батьківської) таблиці.

Цілість даних (referential integrity) — набір правил, що забезпечують відповідність ключових значень у пов'язаних таблицях.

Процедури, що зберігаються (stored procedures) — програмні модулі, що зберігаються в базі даних для виконання певних операцій з інформацією бази.

Тригери (triggers) — збережені процедури, що забезпечують дотримання умов цілісності даних в операціях зміни первинних ключів (можливо каскадна зміна даних), видалення записів в головній таблиці (каскадне видалення в дочірніх таблицях) і додавання записів або зміни даних у дочірніх таблицях.

Об'єкт (object) - елемент інформаційної системи, що має певні властивості (properties) і певним чином реагує на зовнішні події (events).

Система — сукупність взаємодіючих між собою та із зовнішнім оточенням об'єктів.

Реплікація бази даних — створення копій бази даних (реплік), які можуть обмінюватися оновлюваними даними або реплікованими формами, звітами або іншими об'єктами в результаті процесу синхронізації.

Транзакція — зміна інформації в базі в результаті виконання однієї операції або їхньої послідовності, яка має бути виконана повністю або не виконана взагалі. У СУБД є спеціальні механізми забезпечення транзакцій.

Мова SQL (Structured Query Language) - універсальна мова роботи з базами даних, що включає можливості її створення, модифікації структури, відбору даних на запити, модифікації інформації в базі та інші операції маніпулювання базою даних.

Null — значення поля таблиці, яке показує, що інформація у цьому полі відсутня. Дозвіл на можливість існування значення Null може задаватися окремих полів таблиці.

2.2. Класифікація баз даних

За технологією обробки даних бази даних поділяються на централізовані та розподілені.

Централізована база даних зберігається у пам'яті однієї обчислювальної системи. Ця обчислювальна система може бути мейнфреймом – тоді доступ до неї організується з використанням терміналів – або файловим сервером локальної мережі ПК.

Розподілена база даних складається з кількох, можливо, частин, що перетинаються або навіть дублюють один одного, які зберігаються в різних ЕОМ обчислювальної мережі. Робота з такою базою здійснюється за допомогою системи керування розподіленою базою даних (СУРБД).

За способом доступу до даних бази даних поділяються на бази даних з локальним доступом та бази даних із мережним доступом.

Для всіх сучасних баз даних можна організувати мережевий доступ з розрахованим на багато користувачів режимом роботи.

Централізовані бази даних із мережним доступом можуть мати таку архітектуру:

  • файл-сервер;
  • клієнт-сервер бази даних;
  • "тонкий клієнт" - сервер додатків - сервер бази даних (трирівнева архітектура).

Мал. 1. Схема роботи з БД у локальній мережі з виділеним файловим сервером

Файл-серверАрхітектура систем БД з мережним доступом передбачає виділення однієї з машин мережі як центральну (файловий сервер). На цьому комп'ютері встановлюється операційна система (ОС) для виділеного сервера (наприклад, Microsoft Windows Server 2003). На ньому зберігається спільно використовувана централізована БД у вигляді одного або групи файлів. Всі інші комп'ютери мережі виконують функції робочих станцій (можуть працювати в Microsoft Windows 2000 Professional або Microsoft Windows 98). Файли бази даних відповідно до запитів користувача передаються на робочі станції, де і проводиться обробка інформації (рис. 1). При великій інтенсивності доступу до тих самих даних продуктивність інформаційної системи падає. Користувачі можуть створювати локальні БД на робочих станціях.

Мал. 2. Схема роботи з БД в архітектурі «Клієнт-сервер»

Клієнт-сервер.У цій архітектурі на виділеному сервері, що працює під керуванням серверною операційної системи, встановлюється спеціальне програмне забезпечення (ПЗ) — сервер БД, наприклад Microsoft SQL Server або Oracle. СУБД поділяється на дві частини: клієнтську та серверну. Основа роботи сервера БД – використання мови запитів (SQL). Запит мовою SQL, переданий клієнтом (робочою станцією) серверу БД, породжує пошук та вилучення даних на сервері. Вилучені дані транспортуються мережею від сервера до клієнта (рис. 2). Тим самим кількість інформації, що передається по мережі, зменшується в багато разів.

Трирівнева архітектура функціонує в інтранет- та інтернет-мережах. Клієнтська частина («тонкий клієнт»), що взаємодіє з користувачем, є HTML-сторінку в Web-браузері або Windows-додаток, що взаємодіє з Web-сервісами. Вся програмна логіка винесена на сервер додатків, який забезпечує формування запитів до бази даних, що передаються виконання серверу баз даних. Сервер програм може бути Web-сервером або спеціалізованою програмою(наприклад, Oracle Forms Server) (рис. 3).

Мал. 3. Схема роботи з БД у трирівневій архітектурі

2.3. Ієрархічні та мережеві моделі даних

У ієрархічної моделі даних є один головний об'єкт та інші — підлеглі — об'єкти, що є різних рівнях ієрархії. Взаємозв'язки об'єктів утворюють ієрархічне дерево з одним кореневим об'єктом.

Ієрархічна БД складається з упорядкованого набору кількох екземплярів одного типу дерева. Автоматично підтримується цілісність посилань між предками та нащадками. Основне правило: ніякий нащадок неспроможна існувати без батька (рис. 4).

Мал. 4. Схема ієрархічної моделі даних

Типовим представником (найвідомішим і найпоширенішим) є Information Management System (IMS) фірми IBM. Перша версія з'явилася 1968 р. Досі підтримується багато баз даних цієї системи.

Мережеві бази даних

Мережевий підхід до організації даних є розширенням ієрархічного. У ієрархічних структурах запис-нащадок повинен мати точно одного предка; у мережевий структурі даних нащадок може мати будь-яку кількість предків.

У мережній моделі даних будь-який об'єкт може бути одночасно і головним, і підлеглим, і може брати участь у освіті будь-якого числа взаємозв'язків з іншими об'єктами. Мережева БД складається з набору записів і набору зв'язків між цими записами, а якщо точніше говорити — з набору екземплярів кожного типу із заданого в схемі БД набору типів запису та набору екземплярів кожного типу із заданого набору типів зв'язку (рис. 5).

Мал. 5. Схема мережевої моделі даних

Типовим представником є ​​Integrated Database Management System (IDMS) компанії Cullinet Software, Inc., призначена для використання на машинах основного класу IBM під управлінням більшості операційних систем. Архітектура системи ґрунтується на пропозиціях Data Base Task Group (DBTG) Комітету з мов програмування Conference on Data Systems Languages ​​(CODASYL) — організації, відповідальної за визначення мови програмування Кобол. Звіт DBTG був опублікований 1971 р., а пізніше з'явилося кілька систем, серед яких IDMS.

2.4. Реляційні бази даних

Реляційні системи далеко не відразу набули широкого поширення. У той час як основні теоретичні результати в цій галузі були отримані ще в 70-х р. і тоді з'явилися перші прототипи реляційних СУБД, довгий час вважалося неможливим домогтися ефективної реалізації таких систем. Однак поступове накопичення методів та алгоритмів організації реляційних баз даних та управління ними призвели до того, що вже в середині 80-х р. реляційні системи практично витіснили зі світового ринку ранні СУБД.

Реляційна модель даних ґрунтується на математичних принципах, що випливають безпосередньо з теорії множин та логіки предикатів. Ці принципи вперше були застосовані в галузі моделювання даних наприкінці 1960-х років. доктором Є. Ф. Коддом, що на той час працював в IBM, а вперше опубліковані в 1970 р.

Технічна стаття «Реляційна модель даних для великих банків даних, що розділяються» доктора Є. Ф. Кодда, опублікована в 1970 р., є родоначальницею сучасної теорії реляційних БД. Доктор Кодд визначив 13 правил реляційної моделі (які називають тринадцятьма правилами Кодда).

13 правил Кодда

  1. Реляційна СУБД має бути здатна повністю управляти базою даних через її реляційні можливості.
  2. Інформаційне правило - вся інформація в реляційній БД (включаючи імена таблиць і стовпців) повинна визначатися як значення в таблицях.
  3. Гарантований доступ — будь-яке значення в реляційній БД має бути гарантовано доступним для використання через комбінацію імені таблиці, значення первинного ключа та імені стовпця.
  4. Підтримка порожніх значень (null value) — СУБД повинна вміти працювати з порожніми значеннями (невідомими або невикористаними значеннями), на відміну від стандартних значень і незалежно для будь-яких доменів.
  5. Онлайновий реляційний каталог - опис БД та її зміст повинні бути представлені на логічному рівні як таблиці, до яких можна застосовувати запити, використовуючи мову бази даних.
  6. Вичерпна мова управління даними — принаймні одна з підтримуваних мов повинна мати чітко визначений синтаксис і бути всеосяжною. Він повинен підтримувати опис структури даних та маніпулювання ними, правила цілісності, авторизацію та транзакції.
  7. Правило оновлення уявлень (views) - всі уявлення, що теоретично оновлюються, можуть бути оновлені через систему.
  8. Вставка, оновлення та видалення - СУБД підтримує не тільки запит на відбір даних, але й вставку, оновлення та видалення.
  9. Фізична незалежність даних - на програми-додатки та спеціальні програми логічно не впливають зміни фізичних методівдоступу до даних та структур сховищ даних.
  10. Логічна незалежність даних - на програми-додатки та спеціальні програми логічно не впливають, у межах розумного, зміни структур таблиць.
  11. Незалежність цілісності - мова БД має бути здатною визначати правила цілісності. Вони повинні зберігатися в онлайновому довіднику, і не повинно бути способу їх обійти.
  12. Незалежність розподілу - на програми-додатки та спеціальні програми логічно не впливає, вперше використовуються дані або повторно.
  13. Непідривність - неможливість обійти правила цілісності, визначені через мову бази даних, використання мов низького рівня.

Основна ідея реляційної алгебри полягає в тому, що якщо відносини є безліччю, засоби маніпулювання відносинами можуть базуватися на традиційних теоретико-множинних операціях, доповнених деякими спеціальними операціями, специфічними для реляційних баз даних

Існує багато підходів до визначення реляційної алгебри, які відрізняються наборами операцій та способами їх інтерпретації, але, в принципі, є більш менш рівносильними. Розширений початковий варіант алгебри, запропонований Коддом, називається алгеброю Кодда.

У цьому варіанті набір основних операцій алгебри складається з восьми операцій, які діляться на два класи - теоретико-множинні операції і спеціальні реляційні операції. До складу теоретико-множинних операцій входять операції:

  • об'єднання відносин;
  • перетину відносин;
  • взяття різниці відносин;
  • взяття декартового твору відносин.

Спеціальні реляційні операції включають:

  • обмеження відношення;
  • проекцію відношення;
  • поєднання відносин;
  • розподіл відносин.

Крім того, до складу алгебри включається операція присвоєння, що дозволяє зберегти в базі даних результати обчислення виразів алгебри, і операція перейменування атрибутів, що дає можливість коректно сформувати заголовок (схему) результуючого відношення.

  • При виконанні операції об'єднання (UNION) двох відносин з однаковими заголовками проводиться відношення, що включає всі кортежі, які входять хоча б до одного з відносин - операндів.
  • Операція перетину (INTERSECT) двох відносин з однаковими заголовками робить відношення, що включає всі кортежі, які входять до обох відносин-операнда.
  • Відношення, що є різницею (MINUS) двох відносин з однаковими заголовками, включає всі кортежі, що входять у відношення - перший операнд, такі, що жоден з них не входить у відношення, яке є другим операндом.
  • При виконанні декартового твору (TIMES) двох відносин, перетин заголовків яких порожньо, проводиться відношення, кортежі якого виробляються шляхом об'єднання кортежів першого та другого операндів.
  • Результатом обмеження (WHERE) відносини за деякою умовою є відношення, що включає кортежі відносини-операнда, що задовольняє цю умову.
  • При виконанні проекції (PROJECT) відношення на задане підмножина безлічі його атрибутів виробляється відношення, кортежі якого є відповідними підмножинами кортежів відношення-операнда.
  • При з'єднанні (JOIN) двох відносин за деякою умовою утворюється результуюче відношення, кортежі якого виробляються шляхом об'єднання кортежів першого та другого відносин і задовольняють цю умову.
  • У операції реляційного поділу (DIVIDE BY) два операнди — бінарні та унарні відносини. Результуюче відношення складається з унарних кортежів, що включають значення першого атрибуту кортежів першого операнда таких, що безліч значень другого атрибуту (при фіксованому значенні першого атрибута) включає безліч значень другого операнда.
  • Операція перейменування (RENAME) здійснює відношення, тіло якого збігається з тілом операнда, але імена атрибутів змінені.
  • Операція присвоєння (:=) дозволяє зберегти результат обчислення реляційного виразу існуючому відношенні БД.

Кодд запропонував застосування реляційної алгебри в СУРБД для розчленування даних у пов'язані набори. Він організував свою систему БД навколо концепції, що базується на наборах даних.

У реляційній моделі дані розбиваються на набори, що становлять табличну структуру. Ця структура таблиць складається з індивідуальних елементів даних, які називаються полями. Поодинокий набір або група полів відома як запис.

Модель даних, або концептуальний опис предметної області, - найабстрактніший рівень проектування баз даних.

З погляду теорії реляційних БД основні принципи реляційної моделі на концептуальному рівні можна сформулювати наступним чином:

  • всі дані подаються у вигляді впорядкованої структури, визначеної у вигляді рядків і стовпців і називається ставленням;
  • Усі значення є скалярами. Це означає, що для будь-якого рядка та стовпця будь-якого відношення існує одне і лише одне значення;
  • всі операції виконуються над цілим відношенням, і результатом їх виконання є ціле відношення. Цей принцип називається замиканням.

Формулюючи принципи реляційної моделі, доктор Кодд вибрав термін «відношення» (relation), тому що, на його думку, цей термін однозначний (тоді як, наприклад, термін «таблиця» має безліч різних видів — таблиця в тексті, електронна таблиця та пр.). Дуже поширена така помилка: реляційна модель названа так тому, що вона визначає зв'язки між таблицями. Насправді назва цієї моделі походить від відносин (таблиць бази даних), що лежать в її основі.

Кожен рядок, що містить дані, називається кортежем, кожен стовпець відносини називається атрибутом (на рівні практичної роботи з сучасними реляційними БД використовуються терміни «запис» та «поле»).

Елементами опису реляційної моделі даних на концептуальному рівні є сутності, атрибути, домени та зв'язки.

Сутність — певний відокремлений об'єкт чи подія, інформацію про яку необхідно зберігати у базі даних, має певний набір властивостей — атрибутів. Сутності можуть бути як фізичні (реально існуючі об'єкти: наприклад, СТУДЕНТ, атрибути — номер залікової книжки, прізвище, його факультет, спеціальність, номер групи тощо), так і абстрактні (наприклад, ЕКЗАМЕН, атрибути — дисципліна, дата, викладач, аудиторія та ін.). Для сутностей розрізняють її тип та екземпляр. Тип характеризується ім'ям та списком властивостей, а екземпляр – конкретними значеннями властивостей.

Атрибути сутності бувають:

  1. Ідентифікуючі та описові.Атрибути, що ідентифікують, мають унікальне значення для сутностей даного типу і є потенційними ключами. Вони дозволяють однозначно розпізнавати екземпляри сутності. Із потенційних ключів вибирається один первинний ключ (ПК). Як ПК зазвичай вибирається потенційний ключ, яким частіше відбувається звернення до екземплярів записи. ПК повинен включати до складу мінімально необхідну для ідентифікації кількість атрибутів. Інші атрибути називаються описовими.
  2. Прості та складові.Простий атрибут складається з одного компонента, його значення неподільне. Складовий атрибут є комбінацією декількох компонентів, які, можливо, належать різним типамданих (наприклад, адреса). Рішення про те, використовувати складовий атрибут або розбивати його на компоненти залежить від особливостей процесів його використання і може бути пов'язане із забезпеченням високої швидкості роботи з великими базами даних.
  3. Однозначні та багатозначні— можуть мати відповідно одне чи багато значень кожного екземпляра сутності.
  4. Основні та похідні.Значення основного атрибута залежить від інших атрибутів. Значення похідного атрибуту обчислюється з урахуванням значень інших атрибутів (наприклад, вік людини обчислюється з урахуванням дати народження і поточної дати).

Специфікація атрибута складається з його назви, вказівки типу даних та опису обмежень цілісності - безлічі значень (або домену), які може приймати цей атрибут.

Домен – це набір усіх допустимих значень, які можуть містити атрибут. Поняття «домен» часто плутають із поняттям «тип даних». Необхідно розрізняти ці поняття. Тип даних – це фізична концепція, а домен – логічна. Наприклад, "ціле число" - це тип даних, а "вік" - це домен.

Зв'язки — на концептуальному рівні є простими асоціаціями між сутностями. Наприклад, твердження «Покупці купують продукти» вказує на те, що між сутностями «Покупці» та «Продукти» існує зв'язок, і такі сутності називаються учасниками цього зв'язку.

Існує кілька типів зв'язків між двома сутностями: це зв'язки "один до одного", "один до багатьох" та "багато до багатьох".

Кожен зв'язок у реляційній моделі характеризується ім'ям, обов'язковістю, типом та ступенем. Розрізняють факультативні та обов'язкові зв'язки. Якщо сутність одного типу виявляється за потребою пов'язаною із сутністю іншого типу, то між цими типами об'єктів існує обов'язковий зв'язок (позначається подвійною лінією). Інакше зв'язок є факультативним.

Ступінь зв'язку визначається кількістю сутностей, які охоплені цим зв'язком. Приклад бінарного зв'язку — зв'язок між відділом та працівниками, які у ньому працюють.

Діаграма "сутності-зв'язку" (Entity-Relationship diagrams, або E/R diagram) служить для опису схеми бази на концептуальному рівні проектування. Метод був запропонований у 1976 р. Пітером Пін Шань Ченом (Peter Pin Shan Chen). На діаграмах «сутності-зв'язку» сутності зображуються як прямокутників, атрибути — як еліпсів, а зв'язку — як ромбів (рис. 6).

Мал. 6. Діаграма «сутності-зв'язку»

Надалі багатьма авторами розробили свої варіанти подібних моделей (нотація Мартіна, нотація IDEF1X, нотація Баркера та інших.). Крім того, різні програмні засоби, що реалізують ту саму нотацію, можуть відрізнятися своїми можливостями. По суті, всі варіанти діаграм «сутність-зв'язок» виходять з однієї ідеї — малюнок завжди наочніший за текстовий опис. Усі такі діаграми використовують графічне зображення сутностей предметної області, їх властивостей (атрибутів) та взаємозв'язків між сутностями.

Проектування схеми БД має вирішувати завдання мінімізації дублювання даних, спрощення та прискорення процедур їх обробки та оновлення. За неправильно спроектованої схеми БД можуть виникнути аномалії модифікації даних. Для розв'язання таких проблем проводиться нормалізація відносин.

Однак у технології роботи зі сховищами даних може використовуватися зворотний прийом - денормалізація відносин з метою збільшення швидкості виконання запитів до великих обсягів архівних даних.

В рамках реляційної моделі даних Е. Ф. Кодді були розроблені принципи нормалізації відносин і запропоновано механізм, що дозволяє будь-яке відношення перетворити до третьої нормальної форми.

Нормалізація - це формальний метод аналізу відносин на основі їх первинного ключа та існуючих зв'язків. Її завдання — заміна однієї схеми (чи сукупності відносин) БД іншою схемою, у якій відносини мають простішу і регулярну структуру.

p align="justify"> При роботі з реляційною моделлю для створення відносин прийнятної якості достатньо виконання вимог першої нормальної форми.

Перша нормальна форма (1НФ) пов'язана з поняттями простого та складного атрибутів. Простий атрибут - це атрибут, значення якого атомарні (тобто неподільні). Складний атрибут може мати значення, що є об'єднанням кількох значень одного або різних доменів. У першій нормальній формі усуваються атрибути, що повторюються, або групи атрибутів, тобто проводиться виявлення неявних сутностей, «замаскованих» під атрибути.

Ставлення наведено до 1НФ, якщо всі його атрибути - прості, тобто значення атрибуту не повинно бути безліччю або групою, що повторюється.

Для приведення таблиць до 1НФ необхідно розбити складні атрибути на прості, а багатозначні атрибути винести окремі відносини.

Друга нормальна форма (2НФ) застосовується до відносин із складовими ключами (що складаються з двох і більше атрибутів) та пов'язана з поняттями функціональної залежності.

Якщо будь-якої миті часу кожному значенню атрибута А відповідає єдине значення атрибута, то В функціонально залежить від А (AB). Атрибут (група атрибутів) називається детермінатором.

У другій нормальній формі усуваються атрибути, що залежать лише від частини унікального ключа. Ця частина унікального ключа визначає окрему суть.

Відношення знаходиться в 2НФ, якщо воно приведено до 1НФ і кожен неключовий атрибут функціонально повно залежить від первинного складового ключа.

Третя нормальна форма (3НФ) пов'язані з поняттям транзитивної залежності. Нехай A, B, C - атрибути певного відношення. При цьому AB і BC, але зворотна відповідність відсутня, тобто C не залежить від B або B не залежить від A. Тоді кажуть, що C транзитивно залежить від A (AC).

У третій нормальній формі усуваються атрибути, які залежать від атрибутів, що не входять до унікального ключа. Ці атрибути є основою окремої сутності.

Відношення знаходиться в 3НФ, якщо воно знаходиться в 2НФ і не має атрибутів, що не входять до первинного ключа і перебувають у транзитивній залежності від первинного ключа.

Існують також нормальна форма Бойса-Кодда (НФБК), 4НФ та 5НФ. Однак найбільше значення має 1НФ, так як наступні НФ пов'язані з поняттями про складові ключі і складні залежності від ключів, а на практиці зустрічаються зазвичай простіші випадки.

Моделювання структури бази даних за допомогою алгоритму нормалізації має серйозні недоліки:

  1. Методика нормалізації передбачає початкове розміщення всіх атрибутів проектованої предметної області щодо одного відношенні, що дуже неприродною операцією. Інтуїтивно розробник одразу проектує кілька відносин відповідно до виявлених сутностей. Навіть якщо вчинити насильство над собою і створити одне або кілька відносин, включивши в них усі передбачувані атрибути, то абсолютно неясним є сенс отриманого відношення.
  2. Неможливо одразу визначити повний список атрибутів. Користувачі мають звичку називати різними іменамиодні й самі речі чи, навпаки, називати одними іменами різні речі.
  3. Для проведення процедури нормалізації необхідно виділити залежності атрибутів, що також дуже нелегко.

У реальному проектуванні структури бази даних застосовується інший метод так зване семантичне моделювання. Семантичне моделювання є моделювання структури даних, що спирається на зміст цих даних. Як інструмент семантичного моделювання використовуються різні варіанти діаграм «сутність-зв'язок» (ERD) з побудовою концептуальної моделі бази даних.

Будь-який фахівець, який освоїв загальні принципиоптимальної організації реляційних баз даних, може побудувати модель, не суперечить принципам нормалізації.

Реляційна БД фізично складається з таблиць, між якими можуть існувати зв'язки за ключовими значеннями. Одночасно з таблицями та інформацією про зв'язки в реляційній базі даних можуть бути присутніми «зберігаючі процедури» і, зокрема, «тригери», що забезпечують дотримання умов цілісності бази.

Дотримання умов цілісності посилання в реляційній базі даних

Правило відповідності зовнішніх ключів первинним - основне правило дотримання умов цілісності посилання. Для кожного значення зовнішнього ключа має існувати відповідне значення первинного ключа батьківської таблиці.

Посилочна цілісність може порушитися внаслідок операцій вставки (додавання), оновлення та видалення записів у таблицях. У визначенні цілісності посилань беруть участь дві таблиці - батьківська і дочірня, для кожної з них можливі ці операції, тому існує шість різних варіантів, які можуть призвести або не призвести до порушення цілісності посилання.

Для батьківської таблиці:

  • Вставлення.Виникає нове значення первинного ключа. Існування записів у батьківській таблиці, на які немає посилань з дочірньої таблиці, припустимо, операція не порушує цілісності посилання.
  • Відновлення.Зміна значення первинного ключа в записі може призвести до порушення цілісності посилання.
  • Видалення.Під час видалення запису видаляється значення первинного ключа. Якщо є записи в дочірній таблиці, які посилаються на ключ запису, що видаляється, то значення зовнішніх ключів стануть некоректними. Операція може призвести до порушення цілісності посилання.

Для дочірньої таблиці:

  • Вставлення.Не можна вставити запис до дочірньої таблиці, якщо для нового записуЗначення зовнішнього ключа некоректне. Операція може призвести до порушення цілісності посилання.
  • Відновлення.При оновленні запису в дочірній таблиці можна спробувати неправильно змінити значення зовнішнього ключа. Операція може призвести до порушення цілісності посилання.
  • Видалення.При видаленні запису дочірньої таблиці посилальна цілісність не порушується.

Таким чином, посилальна цілісність у принципі може бути порушена при виконанні однієї з чотирьох операцій:

  1. Оновлення записів у батьківській таблиці.
  2. Видалення записів у батьківській таблиці.
  3. Вставлення записів у дочірній таблиці.
  4. Оновлення записів у дочірній таблиці.

Основні стратегії підтримки цілісності посилань

Існують дві основні стратегії підтримки цілісності посилань.

RESTRICT (ОБМЕЖИТИ) - не дозволяти виконання операції, що призводить до порушення цілісності посилання.

CASCADE (КАСКАДНЕ ЗМІНА) - дозволити виконання необхідної операції, але внести при цьому необхідні зміни в пов'язаних таблицях так, щоб не допустити порушення цілісності посилання та зберегти всі зв'язки, що є. Зміна починається у батьківській таблиці та каскадно виконується у дочірніх таблицях. У реалізації цієї стратегії є одна тонкість, яка полягає в тому, що дочірні таблиці самі можуть бути батьківськими для деяких третіх таблиць. При цьому може додатково знадобитися виконання будь-якої стратегії і для цього зв'язку і т. д. Якщо при цьому якась із каскадних операцій (будь-якого рівня) не може бути виконана, то необхідно відмовитися від початкової операції та повернути базу даних у вихідний стан . Це складна стратегія, але вона не порушує зв'язків між батьківськими та дочірніми таблицями.

Ці стратегії є стандартними і є у всіх СУБД, у яких є підтримка цілісності.

Додаткові стратегії підтримки цілісності посилань

IGNORE (ІГНОРУВАТИ) — дозволити виконувати операцію без перевірки цілісності посилання. В цьому випадку в дочірній таблиці можуть з'являтися некоректні значення зовнішніх ключів, вся відповідальність за цілісність бази даних лягає на програміста чи користувача.

SET NULL (ЗАДАТИ ЗНАЧЕННЯ NULL) — дозволити виконання необхідної операції, але всі некоректні значення зовнішніх ключів, що виникають, змінювати на null-значення. Ця стратегія має два недоліки. По-перше, для неї потрібний дозвіл на використання null-значень. По-друге, записи дочірньої таблиці втрачають зв'язок із записами батьківської таблиці. Встановити, з яким записом батьківської таблиці пов'язані змінені записи дочірньої таблиці, після виконання операції не можна.

SET DEFAULT (ЗАДАТИ ЗНАЧЕННЯ ЗА УМОВЧАННЯМ) — дозволити виконання необхідної операції, але всі некоректні значення зовнішніх ключів, що виникають, змінювати на деяке значення, прийняте за умовчанням. Перевага цієї стратегії в порівнянні з попередньою в тому, що вона дозволяє не користуватися null-значеннями. Встановити, з якими записами батьківської таблиці пов'язані змінені записи дочірньої таблиці, після виконання такої операції теж не можна.

На рис. 7 наведено приклад реляційної бази, що містить відомості відділу кадрів по працівникам підприємства, в якій для кожної таблиці показаний список її полів і показані зв'язки між таблицями за простим ключем - значення поля tabn.

Мал. 7. Схема реляційної бази даних

Починаючи з 1980-х р., одночасно з широким поширенням персональних комп'ютерів, велике поширення набули так звані «настільні» реляційні СУБД (Desktop Databases), такі як dBase, FoхBase (його пізніші версії — FoхPro та Visual FoхPro), Paradoх, Access . Найбільш поширеним форматом таблиць подібних реляційних баз став *.dbf, з яким працювали dBase, FoхBase, і навіть Clipper — система написання програм (у режимі рядкового компілятора) до роботи з базами даних. Надалі деякі з них стали повноцінними мережевими СУБД, що працюють не тільки в різних операційних системах в архітектурі «файл-сервер», але й мають можливості для роботи з серверами баз даних в архітектурі «клієнт-сервер», а також розробки та використання html- сторінок до роботи з базами даних.

Усі СУБД для ПК можна поділити на три види:

  1. Системи управління базами даних у буквальному значенні цього терміна, котрим робота з базами можлива лише після запуску роботу цієї системи без можливості створення автономних програм, які працюють із базами. До цих систем належать: Access, Paradoх, dBase.
  2. Системи, що мають як засоби для роботи з базами даних, так і можливості розробки виконуваних в операційній системі програм користувача (додатків), тобто засоби розробника програм - FoхPro.
  3. Системи для розробки програм для роботи з базами даних - Clipper, Clarion.

Усі подібні СУБД мають у своєму складі кошти для:

  • створення баз даних та модифікації їх структури; створення індексних файлів;
  • роботи з базами у табличному форматі або у вигляді стандартної форми з розташуванням полів рядково; при цьому можливе редагування даних, додавання записів, видалення записів, робота з даними з кількох таблиць бази, обчислення складних виразівдля заданих умов та ін;
  • розробки екранних форм, що мають, крім полів, що редагуються, пов'язаних з базою даних або зі змінними пам'яті, також елементи управління різного видуу вигляді кнопок; більш складні об'єкти типу списків, що розкриваються, та ін;
  • генерації друкованих форм — звітів складної структури з групуванням даних, з отриманням розрахункових значень та підсумків за групами та загальними підсумками (сума, кількість, середня, максимальна, мінімальна, тощо);
  • розроблення програмних модулів для складної обробки даних;
  • генерації запитів дуже складної структури - з використанням даних із різних баз, завданням складних умов відбору даних, сортування та групування даних.

У системах, орієнтованих на розробника, додатково можливі розробка меню, довідкової системи та проекту, що включає всі перелічені вище компоненти та компілюється у програму, що виконується.

Важливими факторами, що визначають вибір СУБД, є:

  • Формат бази даних, що забезпечує можливість обміну інформацією з іншими програмами операційної системи. Одним із найпоширеніших форматів є dbf-формат, з яким працюють dBase, FoхBase, FoхPro, Visual FoхPro, Clipper. Його «розуміють» усі програми MS Office. Дані з цих баз можна переносити до Word, Eхcel, Access. Свої власні формати даних мають Clarion, Paradoх, Access.
  • Забезпечення секретності та конфіденційності даних мають системи, які не орієнтовані на розробника програм: Access, Paradoх. Однак цей фактор може бути реалізований під час зберігання даних на виділеному сервері, де права різних користувачів легко розмежувати.

Усі сучасні СУБД підтримують режими роботи у локальній мережі багатьох користувачів із однією базою даних. Деякі мають «майстри», «побудовники» та «генератори виразів» для прискореної розробки баз даних, екранних форм, звітів, стандартних програм.

Останні версії СУБД, розроблені для роботи в OC Windows 95, відносяться до класу RAD-систем (Rapid Application Development) – засоби швидкої розробки додатків – та мають об'єктно-орієнтовану мову програмування. Це такі системи як Visual FoхPro, MS Access, Visual dBase та ін.

Постріляційні бази даних

Нині відомі також звані постреляционные СУБД, основу яких лежать модель даних як багатовимірних таблиць (наприклад, у системі Cache фірми InterSystems Сorporation) і широке використання принципів об'єктно-орієнтованого підходу з організацією баз даних, і програмуванні.

Сервери баз даних

У локальних та глобальних комп'ютерних мережах широко застосовуються сервери: комп'ютери та програмні засоби обслуговування клієнтів — робочих станцій та/або інших серверів.

Прикладами серверів можуть бути:

  • файловий сервер, який підтримує загальне сховище файлів для всіх робочих станцій;
  • інтернет-сервер, що забезпечує надання інформації у глобальній мережі Інтернет;
  • поштовий сервер, який забезпечує роботу з електронною поштою;
  • сервер баз даних - СУБД, яка приймає запити по локальній мережі та повертає інформацію, що відповідає запиту.

Термін "сервер баз даних" зазвичай використовують для позначення всієї СУБД, заснованої на архітектурі "клієнт-сервер", включаючи і серверну, і клієнтську частини. Найпоширенішими серверами є нині Microsoft SQL Server, Oracle, IBM DB2 Universal DataBase, Informix та інших. Розмір однієї бази даних цих серверах може сягати мільйона терабайт.

2.5. Розподілені бази даних

Основне завдання систем управління розподіленими базами даних полягає у забезпеченні засобу інтеграції локальних баз даних, що розташовуються в деяких вузлах обчислювальної мережі, для того, щоб користувач, що працює в будь-якому вузлі мережі, мав доступ до всіх цих баз даних як до єдиної бази.

Можливі однорідні та неоднорідні розподілені бази даних. У однорідному випадку кожна локальна база даних керується однією і тією ж СУБД. У неоднорідній системі локальні бази даних можуть належати навіть до різних моделей даних. Мережева інтеграція неоднорідних баз даних - дуже складна проблема. Багато рішень відомі теоретично, але поки що не вдається впоратися з головною проблемою: недостатньою ефективністю інтегрованих систем. Успішніше вирішується проміжне завдання — інтеграція неоднорідних SQL-орієнтованих систем. Цьому значною мірою сприяє стандартизація мови SQL.

Прикладом розподіленої СУБД може бути System R*. У цій системі розробники прикладних програм і кінцеві користувачі залишаються серед мови SQL. Можливість використання SQL ґрунтується на забезпеченні System R* прозорості розташування даних. Система автоматично виявляє поточне розташування об'єктів даних, що згадуються в запиті користувача; одна й та прикладна програма, що включає пропозиції SQL, може бути виконана в різних вузлах мережі. При цьому в кожному вузлі мережі на етапі компіляції запиту вибирається найбільш оптимальний план виконання запиту відповідно до розташування даних у розподіленій системі.

Хрестоматія

Назва роботи Анотація

Практикуми

Назва практикуму Анотація

Презентації

Назва презентації Анотація
Презентації до теми 2

Говорячи докладніше про класифікацію баз даних за характером інформації, що зберігається, ми ви згадаємо фактографічні та документальні.

У системах фактографічного типу в БД зберігається інформація про об'єкти предметної області, що цікавлять користувача, у вигляді «фактів» (наприклад, біографічні дані про співробітників, дані про випуск продукції виробниками тощо). У відповідь на запит користувача видається необхідна інформація про об'єкт (об'єкти), що його цікавить, або повідомлення про те, що шукана інформація відсутня в БД.

У документальних БД одиницею зберігання є який-небудь документ (наприклад, текст закону або статті), і користувачеві у відповідь на його запит видається або посилання на документ, або сам документ, в якому він може знайти інформацію, що його цікавить.

БД документального типу можуть бути організовані по-різному: без зберігання та із зберіганням самого вихідного документа на машинних носіях. До систем першого типу можна віднести бібліографічні та реферативні БД, і навіть БД-покажчики, що відсилають до джерела інформації. Системи, у яких передбачено зберігання повного тексту документа, називають повнотекстовими.

У системах документального типу метою пошуку може бути якась інформація, що зберігається в документах, а й самі документи. Так, можливі запити типу «скільки документів було створено за певний період часу» і т. п. Часто критерієм пошуку як ознак включаються «дата прийняття документа», «ким прийнятий» та інші «вихідні дані» документів.

Класифікація БД щодо способу зберігання даних

Докладніше говорячи про бази даних, що класифікуються за характером зберігання інформації, ми виділимо, що централізовані та розподілені БД передбачають можливість одночасного звернення кількох користувачів до однієї й тієї ж інформації (розрахований на багато користувачів, паралельний режим доступу). Це привносить специфічні проблеми при їх проектуванні та в процесі експлуатації БД.

Рисунок 4 – Приклад централізованої бази даних

Розподілені БД, крім того, мають характерні особливості, пов'язані з тим, що фізично різні частини БД можуть бути розташовані на різних ЕОМ, а логічно, з точки зору користувача, вони повинні бути єдиним цілим.


Рисунок 5 – Приклад розподілених баз даних

Програмне забезпечення, призначене до роботи з базами даних, називається система управління базами даних (СУБД).

Поняття "СУБД"

Система управління базами даних - це сукупність мовних та програмних засобів, яка здійснює доступ до даних, дозволяє їх створювати, змінювати та видаляти, забезпечує безпеку даних тощо. Загалом СУБД - це система, що дозволяє створювати бази даних та маніпулювати відомостями з них. А здійснює цей доступ до даних СУБД за допомогою спеціальної мови – SQL.

SQL - мова структурованих запитів, основним завданням якого є надання простого способузчитування та запису інформації до бази даних.

Отже, найпростіша схемароботи з базою даних виглядає приблизно так:


Малюнок 6 - Схема роботи з базою даних

Класифікація за моделлю даних:

  • 1. Ієрархічна- це модель даних, де використовується подання бази даних у вигляді деревоподібної (ієрархічної) структури, що складається з об'єктів (даних) різних рівнів. Між об'єктами існують зв'язки, кожен об'єкт може включати кілька об'єктів нижчого рівня. Такі об'єкти знаходяться щодо предка (об'єкт ближчий до кореня) до нащадка (об'єкт нижчого рівня), при цьому можлива ситуація, коли об'єкт-предок не має нащадків або має їх кілька, тоді як у об'єкта-нащадка обов'язково лише один предок. Об'єкти, що мають спільного предка, називаються близнюками (у програмуванні стосовно структури даних дерево встояло назву брати);
  • 2. Об'єктна та об'єктно-орієнтована- є системою управління базами даних, у яких інформація представлена ​​як об'єктів, використовується в объектно-ориентированном програмуванні. Об'єктні бази даних від реляційних баз даних, є таблично-ориентированными. Об'єктно-реляційні бази даних є гібридом обох підходів. Об'єктні бази даних було розглянуто на початку 1980-х;
  • 3. Об'єктно-реляційна СУБД (ОРСУБД)- Реляційна СУБД (РСУБД), що підтримує деякі технології, що реалізують об'єктно-орієнтований підхід: об'єкти, класи та успадкування реалізовані в структурі баз даних та мовою запитів.

Об'єктно-реляційними СУБД є, наприклад, широко відомі Oracle Database, Informix, DB2, PostgreSQL;

  • 4. Реляційна модель даних (РМД)- логічна модель даних, прикладна теорія побудови баз даних, яка є додатком до завдань обробки даних таких розділів математики як теорії множин та логіка першого порядку. На реляційній моделі даних будуються реляційні бази даних;
  • 5. Мережева модель даних- логічна модель даних, що є розширенням ієрархічного підходу, строга математична теорія, що описує структурний аспект, аспект цілісності та аспект обробки даних у мережевих базах даних;
  • 6. Функціональна модель данихвикористовує такий підхід визначення об'єкта. Замість того щоб представляти об'єкт записом з певним змістом або кортежем у В-дереві, функціональна модель повідомляє, які функції (або операції) визначені на цьому об'єкті. Уявлення об'єкта - це справа реалізації, і вона визначається на нижчому рівні абстракції.

Класифікація серед постійного зберігання:

  • 1. У вторинній пам'яті, або традиційна (англ. conventional database) – середовищем постійного зберігання є периферійна енергонезалежна пам'ять (вторинна пам'ять), як правило, жорсткий диск.
  • 2. В оперативну пам'ять СУБД поміщає лише кеш та дані для поточної обробки;
  • 3. У оперативної пам'яті(англ. in-memory database, memory-resident database, main memory database) - всі дані стадії виконання перебувають у оперативної пам'яті;
  • 4. У третинній пам'яті(англ. tertiary database) - середовищем постійного зберігання є пристрій масового зберігання, що від'єднується від сервера (третинна пам'ять), як правило, на основі магнітних стрічок або оптичних дисків. У вторинній пам'яті сервера зберігається лише каталог даних третинної пам'яті, файловий кеш та дані для поточної обробки; завантаження самих даних вимагає спеціальної процедури.

Класифікація за вмістом:

  • 1. Географічна;
  • 2. Історична;
  • 3. Наукова;
  • 4. Мультимедійна;
  • 5. Клієнтська.

Класифікація за рівнем розподіленості:

  • 1. Централізована, або зосереджена (англ. centralized database): БД, що повністю підтримується на одному комп'ютері.
  • 2. Розподілена (англ. distributed database): БД, складові якої розміщуються у різних вузлах комп'ютерної мережі відповідно до будь-яким критерієм.
  • 3. Неоднорідна (англ. heterogeneous distributed database): фрагменти розподіленої БД у різних вузлах мережі підтримуються засобами більше однієї СУБД
  • 4. Однорідна (англ. homogeneous distributed database): фрагменти розподіленої БД у різних вузлах мережі підтримуються засобами однієї й тієї ж СУБД.
  • 5. Фрагментована, або секціонована (англ. partitioned database): методом розподілу даних є фрагментування (партиціонування, секціонування), вертикальне або горизонтальне.
  • 6. Тиражована (англ. replicated database): методом розподілу даних є тиражування (реплікація).

Класифікація з технології обробки даних бази даних

  • 1. Централізована база даних- Зберігається в пам'яті однієї обчислювальної системи. Якщо ця обчислювальна система є компонентом мережі ЕОМ, можливий розподіл доступу до такої бази. Такий спосіб використання баз даних часто застосовують у локальних мережах ПК;
  • 2. Розподілена база даних- складається з декількох, можливо перетинаються або навіть дублюючих один одного частин, що зберігаються в різних ЕОМ обчислювальної мережі. Робота з такою базою здійснюється за допомогою системи керування розподіленою базою даних (СУРБД).

Класифікація за способом доступу до даних бази даних:

  • 1. Бази даних із локальним доступом;
  • 2. бази даних із віддаленим (мережним) доступом - системи централізованих баз даних із мережним доступом припускають різні архітектури подібних систем:
    • * файл-сервер;
    • * клієнт-сервер.

Файл-серверАрхітектура систем БД з мережним доступом передбачає виділення однієї з машин мережі як центральну (сервер, файлів). На такій машині зберігається централізована БД, що спільно використовується. Всі інші машини мережі виконують функції робочих станцій, за допомогою яких підтримується доступ системи користувача до централізованої бази даних. Файли бази даних відповідно до запитів користувача передаються на робочі станції, де в основному і проводиться обробка. При великій інтенсивності доступу до тих самих даних продуктивність інформаційної системи падає. Користувачі можуть створювати на робочих станціях локальні БД, які використовуються ними монопольно.

Клієнт-сервер.У цій концепції мається на увазі, що крім зберігання централізованої бази даних, центральна машина (сервер бази даних) повинна забезпечувати виконання основного обсягу обробки даних. Запит на дані, що видається клієнтом (робочою станцією), породжує пошук та вилучення даних на сервері. Вилучені дані (але не файли) транспортуються мережею від сервера до клієнта. Специфікою архітектури клієнт-сервер є використання мови запитів SOL.

Класифікація з предметних областей використання:

1. Документальні та документографічні БД - містять описи документів. Залежно від змісту опису розрізняють документографічні БД типів БО (тільки бібліографічний опис документа), БК (бібліографічний опис та ключові слова) та БКР (бібліографічний опис, ключові слова, реферат чи анотація). З'явилися також повнотекстові БД, які містять повні тексти документів, які є документальними.

Документографічні системи, як правило, будуються за двоконтурною схемою: перший контур містить документографічну БД і використовується для автоматизованого пошуку документів, другий контур у разі потреби забезпечує видачу повного тексту документа у вигляді копії першоджерела на папері, мікрофільмі або виводить текст на екран з оптичного диска ( у деяких випадках із жорсткого магнітного диска великої ємності).

У складі даного класу виділено такі види БД:

  • - за науково-технічними документами, що публікуються;
  • - за документами, що публікуються в галузі суспільних наук;
  • - за патентними документами;
  • - за звітами з НДР, ДКР, програмних засобів;
  • - за матеріалами міжгалузевого обміну (науково-технічними досягненнями, ППТО, ІЛ, каталожна, виставкова інформація тощо);
  • - за стандартами та іншою нормативно-технічною документацією;
  • - бібліографічні БД, створювані у бібліотеках, книговидавничих та книготорговельних організаціях;
  • - реферативні та повнотекстові БД з суспільно-політичної інформації, що створюються засобами масової інформації;
  • - БД законодавчої та правової інформації;
  • - документографічні документографічні по спеціальним видамдокументів;
  • - БД з архівних документів. Аналіз стану справ з ДБД різних видів у країні показує, що в даний час найбільшого розвитку отримали ДБД документографічного типу, головним чином, за опублікованими документами в галузі науково-технічної інформації, суспільних наук, патентними документами, звітами з НДР, ДКР та іншими видами документів, створені у межах системи науково-технічної інформації.
  • 2. Система баз даних про продукцію - Інформація про продукцію є основним видом техніко-економічної інформації. Дані про продукцію характеризуються:
    • - величезною і найчастіше невпорядкованою номенклатурою (від 10 млн. до 1 млрд. найменувань), тільки в ОКП міститься 25 млн. позицій, у системі креслярського господарства налічується до 16 млн. кріпильних виробів, є відомості про більш ніж 6 млн. хімічних сполук та т.п.;
    • - різнорідністю та багатофункціональністю застосування та опису продукції на всіх етапах її життєвого циклу;
    • - великою кількістю властивостей (ознак), що характеризують окремі групи продукції (до 200 ознак);
    • - різноманіттям сфер застосування продукції, що охоплюють усі сфери народногосподарської діяльності;
    • - численними та різноманітними зв'язками між продукцією та іншими видами інформації (зв'язок з підприємствами-розробниками та виробниками, комплектуючими виробами, сировиною та ресурсами, технологічними процесами, роботами та послугами, станом довкілляі т.п.);
    • - великою кількістю та різноманітністю категорій груп користувачів;
    • - Наявністю великої кількості розрізняються і нев'язаних між собою систем класифікації та кодування продукції (ОКП, ЕСКД, ЕТНВТ, гармонізована система опису та кодування товарів, система штрихового кодування, галузеві та локальні системи тощо);

Число користувачів системи баз даних з продукції досягає десятків тисяч (підприємств промисловості та сільського господарствапонад 100 тис., керівників та виконавчих органів - понад 50 тис., кооперативи, орендні та індивідуальні підприємства тощо).

3. Економічна та кон'юнктурна інформація - створення баз та банків економічної та кон'юнктурної інформації є важливим фактором функціонування суспільства в умовах початку регульованої ринкової економіки.

У попередні роки бази економічних даних створювалися та функціонували у складі АСПР Держплану СРСР, ЄСІС Держкомстату Росії, АСФР Мінфіну Росії, АСУ Держпостачу СРСР, ОАСУ Держбанку, інших міністерств та відомств, територіальних органів управління підприємств та організацій.

Розвиток інформаційного забезпечення регульованої ринкової економікивідбуватиметься з урахуванням 2 основних факторів:

  • - скорочення обсягу звітних даних, що подаються підприємствами та організаціями органам управління та державної статистики.
  • - суттєве зростання інформаційних потреб Ради федерації, підприємств, організацій, населення, органів територіального та міжгалузевого управління соціально-економічної інформації.

Основним напрямом розвитку БД соціально-економічної та кон'юнктурної інформації є створення наступних інтегрованих БД:

1) регістри та БД обліково-статистичних одиниць:

a. паспорти соціально-економічного розвитку адміністративно-територіальних одиниць (суб'єктів федерації, влади самоврядування)

b. структурних господарських одиниць з усіх галузей економіки незалежно від видів власності, зокрема, регістри промислових, сільськогосподарських, будівельних підприємств, наукових та проектних організацій, фермерських господарств тощо;

c. регістри будівництв.

  • 2) інтегровані БД для комплексного аналізу стану та розвитку галузей економіки.
  • 3) БД річних балансів діяльності, підприємств, організацій та їх об'єднань, територій та регіонів.
  • 4) БД масових переписів, одноразових обліків та вибіркових обстежень.
  • 5) БД з банківських трансфертів.
  • 6) БД щодо доходів і витрат населення, включаючи БД із сімейних бюджетів.
  • 4. Фактографічні бази соціальних даних - соціальними даними відносяться дані про населення і соціальне середовище. Відомості про населення включають статеві, соціальні, медичні та будь-які інші персональні дані про окремих осіб, а також зведені дані про населення країни в цілому та її окремих територіях та про певні групи населення: пенсіонерів, квартиронаймачів, дітей шкільного віку, жінок та ін.

Відомості про соціальне середовище включають дані про вакансії, містобудування, міське господарство, міський пасажирський транспорт, закони, порушення громадського порядкута ін.

Переважна більшість баз соціальних даних формується у межах систем місцевих органів влади. Джерелами таких даних, як правило, формалізовані документи.

Споживачами баз соціальних даних є населення, органи управління різних рівнів та сфер, починаючи від житлово-експлуатаційних контор та управлінь та закінчуючи Федеральними Зборами, а також науковці.

5. Бази даних транспортних систем країни - пунктом проектування мережі баз даних оцінка її сучасного стану.

У рамках окремих видівтранспорту та їх АСУ створено та функціонують як окремі бази та банки даних, так і потужні інформаційні системи.

На повітряному транспорті функціонує мережа ЕОМ "Сірена", що забезпечує автоматизацію продажу авіаквитків. Мережа розвивається і має охопити всю територію країни.

На залізничному транспорті створено систему "Експрес". До її функцій входить не лише резервування та продаж залізничних квитків, а й видача довідок про наявність місць.

На морському транспорті в рамках інформаційно-пошукових систем "Пароплавства", "Порти", "Судорімотні заводи". "Суда" функціонують бази даних для планування та регулювання роботи флоту та портів, бази даних про технічному станіфлоту.

На автомобільному транспорті в рамках інформаційно-пошукових систем функціонують як документографічні бази даних АСНТІ, "Винаходи", "Норми", "Стандарти", "Директиви", так і фактографічні-"Гаро", "Автотранспорт", "Неліквіди", "Економіка "Будівництво".

  • 6. Довідкові бази для населення та організацій - у розвинених країнах існує практика використання БД для інформаційно-довідкового обслуговування населення та установ. Для цього організується доступ до БД авіаперевізників з метою надання довідок, наприклад, про розклад літаків та поїздів; про адреси та телефони громадян та організацій; про програми радіо та телебачення; про проведення виставок тощо. Крім того, створюються спеціальні інформаційно-довідкові БД, серед яких можна виділити такі види:
    • - енциклопедії та довідники;
    • - покажчики фірм, підприємств та організацій;
    • - біографічні дані ("Хто є хто");
    • - Опис нових видів споживчих товарів;
    • - покажчики урядових контрактів, субсидій та інших.

У нашій країні цей вид БД нині розвинуться великі довідкові служби надають такі послуги, переважно з використанням ручних чи автоматизованих картотек. Деякі види довідкових БНД відсутні.

7. Система ресурсних баз даних – проблеми природних ресурсівзаймають особливе місце у розвитку будь-якої держави, визначаючи ступінь її незалежності та процвітання.

Повна, достовірна поінформованість у цьому питанні з метою контролю, аналізу та прогнозування стану ресурсів є однією з пріоритетних потреб на користь об'єктивних, науково-обґрунтованих оцінок можливих шляхів розвитку суспільства.

Систему БД природних ресурсів відрізняє ряд особливостей, зокрема:

  • - Різноманітність видів об'єктів ресурсів БД;
  • - взаємозалежність та взаємозамінність різних видів ресурсів, а отже, необхідність забезпечення інформаційного взаємозв'язку та сумісності інформації про них;
  • - існування великої кількості як централізованих, і регіональних і відомчих джерел информации;
  • - Різні форми подання інформації в інформаційних потоках (цифрової, текстової, графічної, картографічної тощо);
  • - Великий діапазон обсягів і часових параметрів інформаційних потоків, одержуваних як за допомогою датчиків, так і ручним введенням;
  • - Вплив стану ресурсів та навколишнього середовища одного регіону на інші.
  • 8. Фактографічні бази та банки наукових даних- сучасний етапРозвиток науки характеризується переходом на якісно новий рівень досліджень, що визначається широким використанням методів та засобів інформатики - науки про закони та методи накопичення, обробки та передачі інформації. У науці застосування методів та засобів інформатики має не лише звільнити дослідника від рутинної роботи з пошуку та підготовки до використання відомої інформації, але й забезпечити реалізацію єдиної лінії математичної технології вирішення завдань – від формулювання математичних моделей та їх повного інформаційного забезпечення всіма необхідними даними до формування програмних комплексів та проведення вирішення поставлених завдань. Важливо, щоб ця лінія була безперервною та оперативно чинною, без технологічних розривів в обробці даних. По суті, це визначається рішучим перетворенням розрізненої інформації, окремих наборів даних та індивідуальних програм на єдиний інформаційний та програмний продукт, а також всебічним застосуванням сучасних прийомів маніпулювання такими продуктами з використанням засобів обчислювальної техніки.
  • 9. БД у галузі культури та мистецтва - БД для автоматизації лексикографії можуть мати значний економічний ефект у разі інтеграції ЛБД з автоматизованими видавничими системами, що має за кордоном масове застосування. Слід пам'ятати, що БД всіх трьох типів істотно перетинаються між собою за складом даних, хоча мають багато специфічні властивості. У той же час багато БД мають досить великі обсяги (до сотень тисяч і навіть мільйонів записів), тому їх створення та ведення потребують значних коштів та трудовитрат.
  • 10. Лінгвістичні БД- Лінгвістичні БД (ЛБД) містять дані про мовні одиниці різних рівнів (від морфеми до тексту) та різноманітну інформацію про ці одиниці.

ЛБД мають три основні сфери застосування:

  • - Забезпечення функціонування різних автоматизованих систем, пов'язаних з обробкою тексту та мовлення (інформаційні, експертні, навчальні системи, системи аналізу мовлення, машинного перекладу та ін);
  • - автоматизація лексикографічної діяльності масового та спеціального призначення, тобто підготовка словників різного типу(навчальних, перекладацьких, нормативних, тлумачних та ін.);
  • - автоматизація праці дослідників: лінгвістів, викладачів мов та інших філологів.

база даних зберігання інформація

ТЕМА 2 КЛАСИФІКАЦІЯ БНД

Питання, що вивчаються:

1. Класифікація БД

2. Класифікація СУБД

Література:, Розділ 1, Глава 2, Глава 3.

БНД є складними системами, та їх класифікація може бути проведена як для всього БНД в цілому, так і для кожної його компоненти окремо. Класифікація кожної компоненти може бути проведена за безліччю різних ознак.

1. Класифікація БД

1) За формою подання інформації розрізняють візуальніі аудіо системи, а також системи мультимедіа. Ця класифікація показує, в якому вигляді інформація зберігається в БД і видається користувачам: у вигляді зображення (символьний текст, малюнки, креслення, фотографії і т.д.) звуку або дається можливість використання різних форм відображення інформації.

2) За характером організації даних БД можуть бути поділені на неструктуровані(БД у вигляді семантичних мереж), частково структуровані(наприклад, БД у вигляді звичайного тексту або гіпертекстові системи) та структуровані(вимагають попереднього проектування та описи структури БД, тільки після цього можуть бути заповнені даними). Ця ознака відноситься до інформації, поданої у символьному вигляді.

3) Структуровані БД за типом використовуваної моделі даних поділяються на ієрархічні, мережеві, реляційні, змішаніі мультимодельні. Розвиток технологій обробки даних призвів до появи постріляційних, об'єктно-реляційних або гібридних , об'єктно-орієнтованих , багатовимірних БД.

4) За типом інформації, що зберігається БД діляться на документальніі лексикографічні. Серед документальних баз розрізняють бібліографічні, реферативніі повнотекстові.

До лексикографічнимБД відносяться різні словники, класифікатори, рубрикатори і т. д. Вони зазвичай використовуються як довідкові спільно з документальними або фактографічними БД.

У документальнихБД одиницею зберігання є документ ( наприклад, текст закону чи статті). Пошук та видача документів відбувається за їх змістом. Найпростіший метод пошуку базується на використанні дескрипторів ключових слівіз проблемної галузі, що характеризують зміст документа. Їхня сукупність, виділена із запиту, зіставляється з дескрипторами документа («пошуковим зразком»). У відповідь на запит користувача видається або посилання на документ, або сам документ, в якому він може знайти цікаву для нього інформацію.

У системах фактографічноготипу в БД зберігається інформація про об'єкти предметної області, що цікавлять користувача, у вигляді «фактів» ( наприклад, біографічні дані про співробітників, дані про випуск продукції виробниками тощо). У відповідь на запит користувача видається необхідна йому інформація або повідомлення про те, що інформація, що шукається, відсутня в БД.

5) За характером організації зберігання даних та звернення до них розрізняють локальніі розподіленіБД.

Локальна БД – це БД, що призначена для використання одним користувачем. Локальні БД можуть створюватися кожним користувачем самостійно, а можуть витягуватися із загальної БД.

Розподілені БД припускають можливість одночасного звернення кількох користувачів до однієї і тієї ж інформації (розрахований на багато користувачів, паралельний режим доступу). Фізично різні частини БД можуть бути розташовані на різних ЕОМ, а логічно, з погляду користувача, вони повинні бути єдиним цілим.

2. Класифікація СУБД

1) За мовами спілкування СУБД поділяються на відкриті(використовують універсальні мови програмування), замкнуті(власні мови спілкування з користувачами) та змішані.

2) За функціями, що виконуються СУБД поділяються на інформаційніі операційні. Інформаційні СУБДдозволяють організувати зберігання інформації та доступ до неї. Операційні СУБДвиконують досить складну обробку, наприкладавтоматично дозволяють отримувати агреговані показники, що не зберігаються безпосередньо в БД, і т.д.

3) За сферою можливого застосування розрізняють універсальніі спеціалізовані, проблемно-орієнтовані СУБД(Мають потужні виразні засоби, щоб моделювати складні об'єкти).

4) За «потужністю» СУБД поділяються на настільніі корпоративні.Характерними рисами настільних СУБДє порівняно невисокі вимоги до технічних засобів, орієнтація кінцевого користувача, низька вартість.

Корпоративні СУБД забезпечують роботу в розподіленому середовищі, високу продуктивність, підтримку колективної роботи при проектуванні систем, мають розвинені засоби адміністрування та ширші можливості підтримки цілісності. Ці системи складні, дорогі, потребують значних обчислювальних ресурсів.

Таблиця 2.1 – Найбільш популярні настільні СУБД

СУБД

Виробник

Visual dBase

dBase, Inc

Paradox

Corel

Microsoft Access

Microsoft

Microsoft FoxPro

Microsoft

Microsoft Data Engine

Microsoft

Таблиця 2.2 – Серверні СУБД

СУБД

Виробник

Oracle

Oracle Corp.

Microsoft SQL Server

Microsoft

Informix

Informix

Sybase

Sybase

5) За орієнтацією на переважну категорію користувачів можна виділити СУБД для розробниківі для кінцевих користувачів.

Системи, орієнтовані на розробників , повинні:

¾ мати якісні компілятори;

¾ дозволяти створювати програмні продукти, що «відчужуються»;

¾ володіти розвиненими засобами налагодження;

¾ включати засоби документування проекту;

¾ мати можливості, що дозволяють створювати ефективні складні системи.

Основними вимогами, що пред'являються до систем, орієнтованих на кінцевого користувача, є:

¾ зручність інтерфейсу;

¾ високий рівень мовних засобів;

¾ наявність інтелектуальних модулів підказок;

¾ підвищений захист від ненавмисних помилок («захист від дурня») тощо.

3. Класифікація банків даних

1) За умовами надання послуг розрізняють безкоштовні та платні. Платні діляться на комерційні та безприбуткові.

Безприбуткові БД функціонують на принципі самоокупності і не ставлять за мету отримання прибутку (наукові, бібліотечні або соціально-значущі БНД).

Основною метою створення комерційних БНДє отримання прибуток від інформаційної діяльності.

2) За формою власності БНД поділяються на державні та недержавні (приватні, групові, особисті).

3) За ступенем доступності розрізняють загальнодоступні та з обмеженим колом користувачів .

4) За охопленням предметної області БНД можуть класифікуватися в різних «розрізах»:

¾ територіальний (світовий, країна, місто тощо);

¾ тимчасової (рік, місяць, з початку століття тощо);

¾ відомчий ;

¾ проблемний (тематичний ) .

5) За характером взаємодії з користувачем БНД поділяються на активні та пасивні. У пасивних БНДпровідна роль належить користувачеві. У активних- Система може самостійно змінювати поведінку.

6) За характером переважної обробки інформації розрізняють OLTP - системи (On - Line Transaction Processing ) – системи оперативної обробки транзакцій(реалізують велику кількість досить простих запитів) та OLAP - системи (On - Line Analytical Processing ) – системи аналітичної обробки даних(реалізують складну аналітичну обробку даних) або системи підтримки ухвалення стратегічних рішень (СППР).

До середини 90-х ХХ ст. Під БД розуміли статичні БД ( OLTP ). До середини 90-х років у БД класу OLTP накопичилося стільки хронологічної інформації, що обсяг БД різко зріс, а швидкодія почала падати. Наприклад, у роботі деканату найчастіше потрібні детальні дані про поточний навчальний рік. У той самий час у БД зберігаються ретроспективні дані й у попередні роки. Такі дані необхідні значно рідше і найчастіше в агрегованому вигляді. Наприклад, видати прізвища студентів, які три останні семестри отримували лише відмінні оцінки.

Таблиця 2.3 – Порівняння OLTP та OLAP

Характеристика

OLTP

OLAP

Переважні операції

Введення даних, пошук

Аналіз даних

Характер запитів

Багато простих транзакцій

Складні транзакції

Збережені дані

Оперативні, деталізовані

Охоплюють великий період часу, агреговані

Вид діяльності

Оперативна, тактична, нескладна обробка

Аналітична, стратегічна: прогнозування, моделювання, аналіз та виявлення зв'язків, виявлення статистичних закономірностей

Тип даних

Структуровані

Різнотипні

Період зберігання даних

До року

До кількох десятків років

Мінливість даних

змінюються

Додаються

Упорядкування даних

По будь-якому полю

За хронологією

Обсяг оброблюваної інформації

Невеликий

Дуже великий

Швидкість обробки

Середня

Дуже висока

Часто і невеликими порціями

Рідко та дуже великими порціями

Окремі БД можуть об'єднувати всі дані, необхідні рішення однієї чи кількох прикладних завдань, чи дані, які стосуються будь-якої предметної галузі (наприклад, фінансам, студентам, викладачам тощо.). Перші зазвичай називають прикладними БД , а другі - предметними БД (що співвідноситься з предметами організації, а чи не з її інформаційними додатками).

Предметні БД дозволяють забезпечити підтримку будь-яких поточних і майбутніх додатків, оскільки набір їх елементів даних включає набори елементів даних прикладних БД. Внаслідок цього предметні БД створюють основу для обробки неформалізованих, змінних та невідомих запитів та додатків (додатків, для яких неможливо заздалегідь визначити вимоги до даних). Така гнучкість і пристосовність дозволяє створювати з урахуванням предметних БД досить стабільні інформаційні системи, тобто. системи, у яких більшість змін можна здійснити без вимушеного листування старих додатків.

Вступ

Глава 1. Основи баз даних

1.1.Класифікація баз даних

1.3 Моделі опису баз даних

1.4. Основи роботи настільних СУБД

1.5.Вимоги та стандарти, що пред'являються до баз даних

Розділ 2. Робота з базою даних Microsoft Access

2.1. Основи роботи настільної СУБД Microsoft Access

2.2. Робота з базою даних Microsoft Access

Висновок

Список використаної літератури

Вступ

Потоки інформації, що циркулюють у світі, що оточує нас, величезні. У

часу вони мають тенденцію до збільшення. Тому в будь-якій організації, як

великою, так і маленькою, виникає проблема такої організації управління

даними, яка б забезпечила найбільш ефективну роботу. Деякі

організації використовують для цього шафи з папками, але більшість віддають перевагу

комп'ютеризовані методи – бази даних, дозволяють ефективно зберігати,

структурувати та систематизувати великі обсяги даних. І вже сьогодні без баз

даних неможливо уявити роботу більшості фінансових, промислових,

торгових та інших організацій. Якби не було баз даних, вони б просто захлинулися в

інформаційної лавини.

Існує багато вагомих причин переведення існуючої інформації на комп'ютерну основу. Зараз вартість зберігання інформації у файлах ЕОМ дешевша, ніж на папері. Бази даних дозволяють зберігати, структурувати інформацію та витягувати

оптимальним для користувача чином. Ця тема актуальна нині, т.к. використання клієнт/серверних технологій дозволяють зберегти значні кошти, а головне і час для отримання необхідної інформації, а також спрощують доступ та ведення, оскільки вони ґрунтуються на комплексній обробці даних та централізації їх зберігання. Крім того, ЕОМ дозволяє зберігати будь-які формати даних, текст, креслення, дані в рукописній формі, фотографії, записи голосу і т.д.

Для використання настільки величезних обсягів інформації, що зберігається, крім розвитку

системних пристроїв, засобів передачі даних, пам'яті, необхідні засоби

забезпечення діалогу людей - ЕОМ, які дозволяють користувачеві вводити

або приймати рішення на підставі даних, що зберігаються. Для забезпечення цих функцій

створено спеціалізовані засоби - системи управління базами даних (СУБД).

Метою даної є розкрити поняття бази даних і системи управління базами даних, а також розглянути на конкретному прикладі роботу настільної СУБД.

1.1.Класифікація баз даних

База даних – це інформаційна модель предметної області, сукупність взаємозалежних, що зберігаються разом даних за наявності такої мінімальної надмірності, яка допускає їх використання оптимальним чином одного чи кількох додатків. Дані (файли) зберігаються у зовнішній пам'яті і використовуються як вхідна інформація для вирішення завдань.

СУБД - це програма, з допомогою якої реалізується централізоване управління даними, які у базі, доступом до них, підтримка в актуальному стані.

Системи управління базами даних можна класифікувати за способом встановлення зв'язків між даними, характером виконуваних ними функцій, сфері застосування, кількості підтримуваних моделей даних, характером мови спілкування з базою даних та іншим параметрам.

Класифікація СУБД:

· За виконуваними функціями СУБД поділяються на операційні та інформаційні;

· За сферою застосування СУБД поділяються на універсальні та проблемно-орієнтовані;

· За мовою спілкування СУБД, що використовується, поділяються на замкнуті, що мають власні самостійні мови спілкування користувачів з базами даних, і відкриті, в яких для спілкування з базою даних використовується мова програмування, розширений операторами мови маніпулювання даними;

· За кількістю підтримуваних рівнів моделей даних СУБД поділяються на одно-, дво-, трирівневі системи;

· За способом встановлення зв'язків між даними розрізняють реляційні, ієрархічні та мережеві бази даних;

· За способом організації зберігання даних та виконання функцій обробки бази даних поділяються на централізовані та розподілені.

Системи централізованих баз даних із мережним доступом передбачають дві основні архітектури – файл-сервер або клієнт-сервер.

Архітектура файл-сервер.Передбачає виділення однієї з машин мережі як центральну (головний сервер файлів), де зберігається спільно використовувана централізована база даних. Усі інші машини виконують роль робочих станцій. Файли бази даних відповідно до запитів користувача передаються на робочі станції, де в основному і проводиться їх обробка. При великій інтенсивності доступу до тих самих даних продуктивність інформаційної системи падає.

Архітектура клієнт-сервер.Ця модель взаємодії комп'ютерів у мережі для сучасних СУБД фактично стала стандартом. Кожен із підключених до мережі і складових цю архітектуру комп'ютерів грає роль: сервер володіє і розпоряджається інформаційними ресурсами системи, клієнт має можливість ними. Крім зберігання централізованої бази даних, сервер бази даних забезпечує виконання основного обсягу обробки даних. Запит на дані, що видається клієнтом (робочою станцією), породжує пошук та вилучення даних на сервері. Вилучені дані транспортуються мережею від сервера до клієнта. Специфікою архітектури клієнт-сервер є використання мови запиту SQL.

Сервер бази даних є СУБД, що паралельно обробляє запити, що надійшли з усіх робочих станцій. Як правило, клієнт та сервер територіально відокремлені один від одного, і в цьому випадку вони утворюють систему розподіленої обробки даних.

1.2. Функціональні можливості СУБД

Характеристиками СУБД є:

· продуктивність;

· Забезпечення цілісності даних на рівні баз даних;

· Забезпечення безпеки даних;

· Можливість роботи в розрахованих на багато користувачів середовищах;

· Можливість імпорту та експорту даних;

· Забезпечення доступу до даних за допомогою мови SQL;

· Можливість складання запитів;

· Наявність інструментальних засобів розробки прикладних програм.

Продуктивність СУБД оцінюється:

· Часом виконання запитів;

· Швидкістю пошуку інформації;

· Часом імпортування баз даних з інших форматів;

· Швидкістю виконання операцій (таких як оновлення, вставка, видалення);

· часом генерації звіту та іншими показниками.

· Безпека даних досягається:

· Шифруванням прикладних програм;

· Шифруванням даних;

· Захистом даних паролем;

· Обмеженням доступу до бази даних (до таблиці, до словника і т.д.).

Забезпечення цілісності даних передбачає наявність коштів, дозволяють переконатися, що у базі даних завжди залишається коректною і повної. Цілісність даних повинна забезпечуватись незалежно від того, яким чином дані заносяться в пам'ять (в інтерактивному режимі, за допомогою імпорту або за допомогою спеціальної програми). СУБД, що використовуються в даний час, мають засоби забезпечення цілісності даних і надійної безпеки.

Система управління базами даних керує даними у зовнішній пам'яті, забезпечує надійне зберігання даних та підтримку відповідних мов бази даних. Важливою функцієюСУБД є функцією управління буферами оперативної пам'яті. Зазвичай СУБД працюють із базами даних великих розмірів, які часто перевищують розміри оперативної пам'яті ЕОМ. У розвинених СУБД підтримується свій набір буферів оперативної пам'яті з дисципліною їх заміни.

Найбільшого поширення нині отримали системи управління базами даних Microsoft Access і Oracle.

Етапами роботи в СУБД є:

· Створення структури бази даних, тобто. визначення переліку полів, з яких складається кожен запис таблиці, типів та розмірів полів (числовий, текстовий, логічний тощо), визначення ключових полів для забезпечення необхідних зв'язків між даними та таблицями;

· Введення та редагування даних у таблицях баз даних за допомогою стандартної форми, що представляється за умовчанням, у вигляді таблиці та за допомогою екранних форм, спеціально створюваних користувачем;

· Обробка даних, що містяться в таблицях, на основі запитів і на основі програми;

· Виведення інформації з ЕОМ з використанням звітів і без використання звітів.

Реалізуються ці етапи роботи за допомогою різних команд.

Централізована база даних забезпечує простоту управління, покращене використання даних на місцях при виконанні дистанційних запитів, більш високий рівень одночасності обробки, менші витрати на обробку.

Розподілена база даних передбачає зберігання та виконання функцій управління даними у кількох вузлах та передачу даних між цими вузлами у процесі виконання запитів. У такій базі даних не тільки її таблиці можуть зберігатися на різних комп'ютерах, а й різні фрагменти однієї таблиці. При цьому для користувача не має значення, як організовано зберігання даних, він працює з такою базою, як з централізованою.

1.3.Моделі опису баз даних

Відомі три типи моделей опису баз даних – ієрархічна, мережева та реляційна, основна відмінність між якими полягає в характері опису взаємозв'язків та взаємодії між об'єктами та атрибутами бази даних.

Ієрархічна модельпередбачає використання для опису бази даних деревоподібних структур, що складаються з певної кількості рівнів. «Дерево» є ієрархією елементів, званих вузлами. Під елементами розуміється список, сукупність, набір атрибутів, які описують об'єкти.

Як приклад простої ієрархічної структури можна навести адміністративну структуру вищого навчального закладу, елементами якої є: Університет – Факультет – Група. На кожному рівні ієрархії цієї структури можна використовувати різні атрибути. Наприклад, атрибутами третього рівня може бути: спеціалізація групи, чисельний склад, прізвище старости групи та інші.

У даній моделі є кореневий вузол або просто корінь – «Університет», який знаходиться на найвищому рівні ієрархії, а тому не має вузлів, що стоять вище за нього. Кожен вузол моделі має лише один вихідний, що по відношенню до нього на більш високому рівні, але в наступних рівнях класифікації може мати один, два чи більше вузлів, або мати їх взагалі.

Принципи ієрархії:

· Ієрархія завжди починається з кореневої вершини (або головного вузла);

· Вихідний вузол, з якого будується дерево, називається кореневим вузлом або просто коренем, причому одне дерево може мати тільки один корінь;

· Вузол може містити один або кілька атрибутів, що описують об'єкт, що знаходиться в ньому;

· породжені вузли можуть вбудовуватися в "дерево" як у горизонтальному напрямку, так і у вертикальному;

· Доступ до породжених вузлів можливий тільки через вихідний вузол, тому існує тільки один шлях доступу до кожного вузла.

Перевагою моделі є простота її побудови, легкість розуміння суті принципу ієрархії, наявність промислових СУБД, які підтримують цю модель. Недоліком є ​​складність операцій із включення до ієрархії інформації про нові об'єкти бази даних та видалення застарілої інформації.

Мережева модельописує елементарні дані та відносини між ними у вигляді орієнтованої мережі. Це такі відносини між об'єктами, коли кожен породжений елемент має більше ніж вихідний і може бути пов'язаний з будь-яким іншим елементом структури. Наприклад, у структурі управління навчальним закладом породжений елемент «Студент» може мати не один, а два вихідні елементи: «Студент – Навчальна група», та «Студент – Кімната у гуртожитку».

Мережеві структури можуть бути багаторівневими та мати різний ступінь складності. Схема, в якій є хоча б один зв'язок «багато хто до багатьох» і який вимагає для своєї реалізації використання складних методів, є складною схемою.

База даних, що описується мережевою моделлю, складається з областей, кожна з яких складається із записів, а останні, у свою чергу, складаються з полів. Недоліком мережевої моделі є її складність, можливість втрати незалежності даних під час реорганізації бази даних. З появою нових користувачів, нових додатків та нових видів запитів відбувається зростання бази даних, що може призвести до порушення логічного представлення даних.

Реляційна модельмає у своїй основі поняття «відносини», та її дані формуються як таблиць. Ставлення – це двовимірна таблиця, що має свою назву, в якій мінімальним об'єктом дій, що зберігає її структуру, є рядок таблиці (кортеж), що складається із осередків таблиці – полів.

Кожен стовпець таблиці відповідає лише одному компоненту цього відношення. З логічного погляду реляційна база даних є безліччю двовимірних таблиць різного предметного наповнення.

Залежно від змісту відносини реляційної бази даних бувають об'єктивними та зв'язковими. Об'єктивні відносини зберігають дані про якийсь один об'єкт, екземплярі сутності. Вони один із атрибутів однозначно визначає об'єкт і називається ключем відносини чи первинним атрибутом (для зручності він записується у першому стовпці таблиці). Інші атрибути функціонально залежать від цього ключа. У об'єктивному відношенні може бути дублюючих об'єктів й у цьому – основне обмеження реляційної бази даних. Зв'язне ставлення зберігає ключі кількох об'єктних відносин, якими з-поміж них встановлюються зв'язку.

Якщо набір атрибутів бази даних заздалегідь не фіксований, то можливі різні варіанти їхнього угруповання, однак, незалежно від обраного способу, повинні дотримуватися єдиних вимог. Зокрема, якщо база даних містить множину відносин, то вони повинні мати мінімальну надмірність подання інформації; атрибути, що включаються до бази даних, мають забезпечувати виконання масових розрахунків; при додаванні до бази даних нових атрибутів перебудова наборів відносин має бути мінімальною.

До переваг реляційної моделі відносяться: простота побудови, доступність розуміння, можливість експлуатації бази даних без знання методів і способів її побудови, незалежність даних, гнучкість структури та інші. Недоліками моделі є: низька продуктивність порівняно з ієрархічною та мережевою моделями, складність програмного забезпечення, надмірність.

1.4. Настільні СУБД

Настільні СУБД відрізняються тим, що використовують модель обчислень з мережею і файловим сервером (архітектура «файл-сервер»). Збільшення складності завдань, поява персональних комп'ютерів та локальних обчислювальних мереж стало причиною появи нової архітектури «файл-сервер». Ця архітектура баз даних з мережним доступом передбачає призначення одного з комп'ютерів мережі як виділений сервер, на якому зберігатимуться файли бази даних. Відповідно до запитів користувачів файли з файл-сервера передаються на робочі станції користувачів, де здійснюється основна частина обробки даних. Центральний сервер виконує переважно лише роль сховища файлів, не беручи участь у обробці самих даних.

Робота побудована таким чином:

База даних як набору файлів перебуває в жорсткому диску спеціально виділеного комп'ютера (файлового сервера). Існує локальна мережа, що складається з клієнтських комп'ютерів, кожному з яких встановлено СУБД і додаток до роботи з БД. На кожному з клієнтських комп'ютерів користувачі мають можливість запустити програму. Використовуючи наданий додатком інтерфейс користувача, він ініціює звернення до БД на вибірку/оновлення інформації.

Всі звернення до БД йдуть через СУБД, яка інкапсулює в собі всі відомості про фізичну структуру БД, розташовану на файловому сервері. СУБД ініціює звернення до даних, що знаходяться на файловому сервері, в результаті яких частина файлів БД копіюється на клієнтський комп'ютер та обробляється, що забезпечує виконання запитів користувача (здійснюються необхідні операції над даними). За потреби (у разі зміни даних) дані відправляються назад на файловий сервер з метою оновлення БД. Результат СУБД повертає у додаток. Програма, використовуючи інтерфейс користувача, відображає результат виконання запитів. В рамках архітектури "файл-сервер" були виконані перші версії популярних т.зв. настільних СУБД, таких як dBase та Microsoft Access.

Вказуються такі основні недоліки даної архітектури: при одночасному зверненні безлічі користувачів до одних і тих самих даних продуктивність роботи різко падає, т.к. необхідно дочекатися, поки користувач, який працює з даними, завершить свою роботу. В іншому випадку можливе затирання виправлень, зроблених одними користувачами, змінами інших користувачів.

На сьогоднішній день відомо більше двох десятків форматів даних настільних СУБД, проте найбільш популярними, виходячи з проданих копій, слід визнати dBase, Paradox, FoxPro і Access. З СУБД, що з'явилися недавно, слід також відзначити Microsoft Data Engine - по суті серверну СУБД, що представляє собою<облегченную>версію Microsoft SQL Server, але призначену для використання головним чином в настільних системах і невеликих робочих групах.

Виробник

http://www.dbase2000.com/

http://www.corel.com/

Microsoft Access 2000

http://www.microsoft.com/

Microsoft FoxPro

http://www.microsoft.com/

Microsoft Visual FoxPro

http://www.microsoft.com/

Microsoft Visual FoxPro

http://www.microsoft.com/

Microsoft Data Engine

http://www.microsoft.com/

1.5.Вимоги та стандарти, що пред'являються до баз даних

До сучасних баз даних, отже, і до СУБД, у яких вони будуються, пред'являються такі основні вимоги:

· Висока швидкодія (малий час відгуку на запит).

Щоб створити нову базу даних за допомогою майстра, виконайте такі дії:

Виконайте команду Файл [Створити]

У вікні діалогу “Створення” виберіть ярлик “Бази даних”. На екрані з'явиться список баз даних, які пропонує майстр. Цей список дуже великий і може досягати кількох десятків різних варіантів, які можуть одночасно використовуватися або послужать основою для побудови інших баз даних. Наприклад, "Замовлення на роботи", "Рахунки", "Контакти", "Заходи", … і т.п.

Виберіть зі списку відповідний зразок бази даних і запустіть на виконання майстер створення бази даних, натиснувши кнопку ОК.

У діалоговому вікні “Файл нової бази даних”, що відкриється, зі списку Папка, виберіть папку, в якій хочете зберегти базу даних, а введіть ім'я в полі Ім'я файлу. Потім натисніть кнопку Створити.

У наступному вікні діалогу майстер повідомляє, яку інформацію міститиме створювана ним база даних. У нижній частині вікна діалогу знаходяться наступні кнопки:

Скасування – припиняє роботу майстра;

Назад – дозволяє повернутися до попереднього кроку у роботі майстра;

Готово - запускає майстер створення бази даних із вибраними параметрами, причому перед натисканням цієї кнопки висвічується інформація, яка зберігатиметься у базі даних.

Вікно діалогу, що відкрилося, містить два списки. Перший - список таблиць бази даних, а другий - список полів обраної таблиці. У цьому списку позначено поля, які будуть включені до таблиці. Зазвичай відзначені майже всі поля таблиць, крім полів, які використовуються досить рідко. Встановлюючи або знімаючи прапорці для полів, можна вибрати поля таблиці. Після вибору поля таблиць натисніть кнопку Далі.

У наступному вікні діалогу виберіть з пропонованих зразків вид оформлення екрану та натисніть кнопку Далі (при цьому на екрані Вам пропонується можливість попереднього перегляду видів оформлення екранів, які можна перебирати у правому вікні вікна діалогу).

На наступному етапі роботи майстра можна визначити вид створюваних для бази даних звітів. Після вибору відповідного виду натисніть кнопку Далі (тут також Вам пропонується попередньо ознайомитися з можливими варіантами, які також можна перебирати).

Вікно діалогу майстра створення бази даних, що відкрилося потім, дозволяє задати її заголовок і малюнок (наприклад, торговий знак фірми), який з'являтиметься у всіх звітах. Якщо Ви вирішили використати малюнок, встановіть прапорець Так. У цьому випадку стає доступною кнопка Малюнок, натискання на яку відкриває вікно діалогу “Вибір малюнка” для вибору заздалегідь створеного Вами файлу з малюнком. Натисніть кнопку Далі, щоб виконати подальші установки.

Натиснувши кнопку Готово в останньому вікнідіалогу, Ви запускаєте майстер на побудову бази даних із встановленими параметрами. Використовуючи кнопку Назад, можна повернутися на будь-який з попередніх кроків і змінити параметри бази даних. Ви можете натиснути кнопку Готово в будь-якому діалоговому вікні майстра, відмовившись від подальшої установки додаткових параметрів. У цьому випадку майстер у своїй роботі використовує установки, які приймаються за умовчанням.

Після натискання кнопки Готово майстер переходить до створення бази даних, що складається з таблиць із заданими Вами полями, найпростіших форм введення та перегляду інформації та найпростіших звітів. Після завершення процесу створення бази даних Ви відразу можете скористатися готовою базою даних: вводити в таблиці дані, переглядати їх і роздруковувати.

Якщо варіанти запропонованих баз даних Вас не влаштовують, то Ви можете створити порожню базу даних та додати до неї таблиці, запити, форми та звіти.

Отже, Ви приступаєте до створення таблиць бази даних, куди згодом вводитиметься інформація. Надалі дані таблиці можуть доповнюватися новими даними, редагуватися чи виключатися з таблиці. Ви можете переглядати дані в таблицях або впорядковувати їх за деякими ознаками. Інформація, що міститься в таблицях, може бути використана для складання звітів. Крім того, Ви можете дати графічну інтерпретацію інформації, яка міститься у базі даних. З розв'язанням цих завдань Ви ознайомитеся у наступних розділах.

Створення таблиці у MS Access здійснюється у вікні бази даних. Розглянемо послідовність Ваших дій під час створення таблиці в новій базі даних:

Відкрийте вікно створеної Вами бази даних та перейдіть на вкладку "Таблиці".

Натисніть кнопку Створити у вікні бази даних.

Відкриється вікно діалогу "Нова таблиця", у правій частині якого знаходиться список варіантів подальшої роботи:

Режим таблиці – дозволяє створити нову таблицю в режимі таблиці;

Конструктор – дозволяє створити нову таблицю в конструкторі таблиць;

Майстер таблиць – дозволяє створити нову таблицю за допомогою майстра;

Імпорт таблиць - дозволяє здійснити імпорт таблиць із зовнішнього файлу до поточної бази даних;

Зв'язок із таблицями - дозволяє здійснити створення таблиць, пов'язаних із таблицями із зовнішніх файлів.

Виберіть з цієї таблиці відповідний варіант створення таблиці і натисніть кнопку ОК.

Створіть структуру таблиці за допомогою вибраного засобу. Створити таблицю можна за допомогою майстра та за допомогою конструктора.

Для того щоб зв'язати таблицю з інформацією, що міститься в ній, кожній таблиці присвоюється ім'я. Задайте ім'я таблиці у діалоговому вікні “Збереження” та натисніть кнопку ОК.

Під час надання імені таблиці, як і імені бази даних, Ви можете не обмежуватися вісьмома символами. Ім'я таблиці, як і імена інших об'єктів бази даних, зберігається у самій базі даних .

Назва поля вводиться в поле введення стовпця ім'я поля. При заданні найменувань полів Ви повинні дотримуватися таких правил:

Назва поля може містити до 64 символів, але не слід зловживати цією можливістю, задаючи занадто довгі імена;

Найменування поля може містити літери, цифри, пробіли та спеціальні символи, за винятком точки (.), знака оклику (!), прямих дужок () і деяких керуючих символів (з кодами ASCII 0-31);

Найменування поля не може починатися з пробілу;

Два поля однієї таблиці що неспроможні мати однакових найменувань;

Недотримання цих правил відстежується засобами СУБД MS Access, але в деяких випадках це може призвести до помилок, які важко визначити, тому рекомендується самостійно контролювати дотримання вищеперелічених правил у практичній роботі.

Бажано намагатися використовувати імена, що відрізняються стислою, для полегшення їх ідентифікації під час перегляду таблиць.

Текстовий;

Числовий;

Грошовий;

Лічильник;

Дати/часу;

Логічний;

Поле MEMO:

поле об'єкта OLE;

Майстер підстановок.

Текстові поля можуть містити літери, цифри та спеціальні символи. Максимальна ширина поля складає 255 символів.

Для зміни ширини поля потрібно в рядку Розмір поля розділу "Властивості поля" вказати число, що визначає ширину поля (від 1 до 255).

Кожен із типів даних наділений власними властивостями, які відображаються у розділі “Властивості поля” вікна конструктора.

Коли ми розглянули типи даних у Access і окремі властивості полів таблиці, можна розпочати створення структури таблиці. Створення структури таблиці розглянемо з прикладу створення таблиці Замовлення бази даних Борей, поставляемой разом із Access. Ця таблиця вже є у базі даних Борей, але розгляд процесу створення цієї таблиці буде дуже корисним. Для того, щоб не порушити структуру бази даних Борей, заздалегідь створіть навчальну базу даних і відкрийте її вікно.

У вікні конструктора таблиці в колонці Ім'я поля введіть Код Замовлення.

Натисніть клавішу Tab або Enter, щоб перейти до стовпця Тип даних. Зверніть увагу, що в нижній частині вікна діалогу з'являється інформація в розділі “Властивості поля”.

У стовпці Тип даних з'явилося Текстовий. Натисніть кнопку розкриття списку в правій частині прямокутника, і Ви побачите список, що містить усі типи даних. З цього списку за допомогою миші або клавішами вгору та вниз виберіть значення Лічильник і натисніть клавішу Tab, щоб перейти до стовпець Опис. Стовпець Опис є поясненням, яке Ви даєте своїм полям. Коли Ви в майбутньому працюватимете з даною таблицею, цей опис з'являтиметься в нижній частині екрана MS Access щоразу, коли Ви опинитеся в полі КодЗамовлення, і нагадає Вам призначення даного поля.

Введіть пояснювальний текст у стовпець Опис і натисніть клавішу Tab або Enter, щоб перейти до введення інформації про наступне поле. Аналогічно введіть опис усіх полів таблиці. Завершивши введення структури таблиці, збережіть її, виконавши команду Файл/Зберегти.

Створення таблиці у режимі таблиці

Ми розглянули два способи створення таблиць, тепер переходимо до третього. Кожен із способів має свої переваги та недоліки. Але ми впевнені, що цей спосіб створення таблиці вразить вас своєю простотою, наочністю і дуже сподобається. Не дарма він розташований першим у списку методів створення таблиць вікна діалогу Нова таблиця. Ви, мабуть, ним найчастіше і користуватиметеся.

Нижче наведено послідовність дій, яку Ви маєте виконати:

Перейдіть на вкладку Таблиці вікна бази даних і натисніть кнопку Створити.

У діалоговому вікні “Нова таблиця” виберіть зі списку варіантів значення Режим таблиці та натисніть кнопку ОК. В результаті виконання цих дій відкриється вікно діалогу "Таблиця", що містить створену за умовчанням таблицю. Ця таблиця містить 20 стовпців і 30 рядків, і цього цілком достатньо для початку. Після збереження цієї таблиці Ви, звичайно, можете додати стільки рядків та стовпців, скільки Вам знадобиться.

Найменування полів таблиці визначено за умовчанням, але навряд чи вони відповідають Вашим вимогам. MS Access дозволяє дуже просто присвоїти полям нові імена. Для цього натисніть двічі кнопкою миші область вибору першого поля (заголовок якого містить Поле 1). Ім'я поля виділяється і з'являється миготливий курсор. Введіть ім'я першого поля та натисніть клавішу Tab. Аналогічно введіть інші імена полів таблиці в наступних стовпцях.

Тепер заповніть кілька рядків Вашої таблиці, вводячи інформацію в тому вигляді, в якому вона буде вводитись і в майбутньому. Намагайтеся записувати все в одному стилі (наприклад, якщо першу дату записали 10/14/09, то не пишіть наступну у вигляді Листопад 3, 2009). Якщо MS Access встановить неправильний тип даних, Ви зможете змінити його, але краще вводити все правильно відразу.

Збережіть таблицю, виконавши команду Файл/Зберегти макет або натиснувши кнопку Зберегти на панелі інструментів. У вікні діалогу "Збереження" присвойте таблиці ім'я і натисніть кнопку ОК.

На запит про необхідність створення таблиці первинного ключа натисніть кнопку Так, і MS Access створить таблицю, видаливши зайві рядки і стовпці.

Тепер переконайтеся, що Access вибрав правильні типи даних для кожного поля. Для цього перейдіть у вікно конструктора таблиці, виконавши команду Вигляд/Конструктор таблиць. Якщо вас щось не влаштовує в структурі таблиці, внесіть необхідні зміни.

У попередньому розділі ми розглянули використання фільтрів, а в цьому розділі розглянемо більше потужний засібвибірки даних – запити.

Насправді часто потрібно вибрати з вихідної таблиці частину записів, які відповідають певним критеріям, і впорядкувати вибірку. Критерії можуть визначатися поєднанням низки умов. Наприклад, Вам необхідно вибрати записи про постачальників певного товару з Мінська та впорядкувати їх в алфавітному порядку за найменуванням фірм. Для вирішення таких завдань призначені майстри запитів та конструктор запитів, за допомогою яких Ви зможете:

Формувати складні критерії вибору записів з однієї чи кількох таблиць;

Вказати поля, які відображаються для вибраних записів;

Виконувати обчислення з використанням вибраних даних.

Що таке “Запит на зразок”

Раніше нами були розглянуті загальні положення, що стосуються баз даних, де ми зазначали, що одним з основних призначень баз даних є швидкий пошукінформації та отримання відповідей на різноманітні питання. Питання, що формулюються стосовно бази даних, називаються запитами. У MS Access для формування запитів використовується конструктор запитів та інструкція мови SELECT MS Access.

Що ж таке “Запит на зразок”? Запит на зразок - це інтерактивний засіб для вибору даних з однієї або кількох таблиць. При формуванні запиту необхідно вказати критерії вибірки записів у вихідній таблиці. При цьому замість того, щоб друкувати пропозиції спеціальною мовою, Ви повинні просто заповнити бланк запиту, який знаходиться у вікні конструктора запитів. Метод формування запиту шляхом заповнення бланка простий для вивчення та розуміння. Він сприяє ефективному використанню можливостей MS Access користувачами, які мають навіть мінімальну навичку роботи з додатком або не мають його зовсім

Вся необхідна інформація знаходиться у таблиці Клієнти бази даних Борей. Тому для створення запиту виконайте такі дії:

У вікні бази даних перейдіть на вкладку “Запити” та натисніть кнопку Створити.

Порядок полів у бланку запиту визначає порядок появи їх у результуючій таблиці. Щоб змінити розташування поля в цьому списку, виконайте такі дії:

Встановіть вказівник миші на область вибору стовпця, який знаходиться прямо над назвою поля. Коли покажчик змінить вигляд стрілки, натисніть кнопку, щоб виділити стовпець.

Натисніть та утримуйте кнопку миші в цьому положенні. На кінці покажчика з'явиться прямокутник.

Переміщайте стовпець у потрібний напрямок. Товста вертикальна лінія покаже поточне положення.

Відпустіть кнопку, коли товста вертикальна лінія опиниться у потрібному місці. Поле буде переміщене до нового місця.

Переміщення стовпця бланка запиту. Іноді не відразу вдається виділити стовпець його переміщення. Переконайтеся, що ви натискаєте область вибору стовпця (маленький прямокутник, що знаходиться прямо над назвою поля). Це єдине місце за яке Ви можете захопити стовпець для перенесення. Для перенесення поля до бланку запиту двічі натисніть мишею на назві поля

ріте Автозвіт.

На екрані за лічені секунди з'явиться готовий до використання звіт. До цього звіту включено всі поля таблиці. Їх назви розташовані вертикально в томж порядку, у якому перебувають у таблиці. Праворуч від назви кожного поля відображається його значення у таблиці.

Висновок

У цій курсової роботибуло розглянуто поняття бази даних і системи управління базами даних, за допомогою якої реалізується централізоване управління даними, що зберігаються в базі, доступ до них, підтримка їх в актуальному стані. Отже, база даних - це сукупність взаємозалежних даних, що спільно зберігаються в одному або декількох комп'ютерних файлах. А також було розглянуто роботу з однією з популярних СУБД Microsoft Access.

СУБД Microsoft Access надає необхідні коштидля роботи з базами даних недосвідченому користувачеві, дозволяючи йому легко і просто створювати бази даних, вводити в них інформацію, обробляти запити та формувати звіти. На жаль, вбудована система допомоги недостатньо зрозуміло пояснює початківцю порядку роботи, тому виникає необхідність у посібнику.


Марченко А. П. Microsoft Access: Короткий курс. – СПб.: Пітер, 2005. – стор. 56

Лазарєв І.П.. “Microsoft Access для чайників”.. СПб – Пітер, 2004. – стор.139.

Лазарєв І.П.. “Microsoft Access для чайників”.. СПб – Пітер, 2004. – стор 196.

Марченко А. П. Microsoft Access: Короткий курс. - СПб.: Пітер, 2005. - 239.

Завантаження...