Меню
Главная
Авторизация/Регистрация
 
Главная arrow Информатика arrow Информатика 2015

6.7. Базы данных

  • — Алло! Это база? Я насчёт сарая...
  • — Извините, но это ракетная база. Вы не туда попали.
  • — Нет, это вы не туда попали!

Анекдот

Одной из важных возможностей ЭВМ является хранение и обработка больших объемов информации, причем происходит накопление не только текстовых и графических документов (рисунки, чертежи, фотографии, географические карты), но и страниц глобальной сети, звуковых и видео файлов. Эти возможности реализуются с помощью баз данных.

База данных (БД) — совокупность данных, организованных по определенным правилам, предусматривающим общие принципы описания, хранения и манипулирования данными, которые относятся к оггределенной предметной области.

Под данными понимается информация, представленная в виде, пригодном для обработки автоматическими средствами при возможном участии человека.

Под предметной областью понимается однородная часть реального мира, которая представляет интерес для конкретног о исследования.

В качестве примеров простейших БД можно назвать телефонный справочник, расггисание движения поездов, сведения о сотрудниках предприятия, каталог товаров и цен на них (прайслист), алфавитный или предметный каталог книг в библиотеке.

Главное достоинство электронных БД— возможность быстрого поиска и отбора информации, а также простая г енерация (создание) отчета по заданной форме. Например, гго номерам зачеток легко определить фамилии студентов или по фамилии писателя составить список его ггроизведений.

Пользователей баз данных можно разделить на три категории: конечные пользователи (те, кто вводят, извлекают и используют данные), программисты и системные аналитики (те, кто пишут прикладные программы обработки данных, определяют логическую структуру БД) и администраторы.

Администратор базы данных — это специалист, отвечающий за выработку требований к базе данных во время её проектирования, успешную реализацию БД в процессе её создания, эффективное использование и сопровождение БД в ггроцессе эксплуатации. Администратор взаимодействует с конечными пользователями и программистами в ггроцессе проектирования БД, контролирует ее работоспособность, отвечает за реорганизацию и своевременное обновление информации, удаление устаревших данных и за воестановление разрушенных данных, за обеспечение безопасности и целостности данных.

Под безопасностью данных понимают защиту данных от случайного или преднамеренного несанкционированного доступа к ним лиц, не имеющих на это права.

Под целостностью понимается возможность восстановления данных в случае возникновения сбоев в работе вычислительной техники. Если БД содержит данные, используемые многими пользователями, то очень важно, чтобы данные и связи между ними не разрушались.

Программисты и системные аналитики, создавая БД, стремятся упорядочить информацию по различным признакам (реквизитам, атрибутам), для того чтобы можно было извлекать из БД информацию с произвольным сочетанием признаков.

В современной технологии использования баз данных предполагается, что создание базы данных, ее поддержка и обеспечение доступа пользователей к ней осуществляется с помощью специального программного обеспечения — систем управления базами данных.

Системы управления базами данных (СУБД) — программы, которые обеспечивают создание БД и организацию данных. СУБД позволяют вводить, отбирать и редактировать данные. Они предоставляют средства для извлечения данных по определенному критерию (требованию, правилу). СУБД дают возможность конечным пользователям осуществлять непосредственное управление данными, а программистам и системным аналитикам быстро разрабатывать более совершенные программные средст ва их обработки.

Рассмотрим существующие классификации баз данных.

По технологии обработки данных БД подразделяются на централизованные и распределенные.

Централизованная БД хранится в памяти одной ЭВМ.

Распределенная БД состоит из нескольких частей (возможно, пересекающихся или даже дублирующих друг друга), хранящихся на различных ЭВМ вычислительной сети.

По способу установления связей между данными различают реляционные, иерархические и сетевые БД.

Реляционная БД является простейшей и наиболее привычной формой представления данных в виде таблиц. В теории множеств таблице соответствует термин «отношение» (relation), который и дал название этой БД. Для нее имеется развитый математический аппарат — реляционное исчисление и реляционная алгебра, в которых определены такие математические операции, как объединение, вычитание, пересечение, соединение и др.

Существенный вклад в разработку БД этого тина сделал американский ученый Е. Кодд (Е. Codd).

Достоинством реляционной БД является сравнительная простота инструментальных средств ее поддержки, недостатком — жесткость структуры данных (невозможность, например, задания строк таблицы произвольной длины) и зависимость скорости ее работы от размера базы данных. Для многих операций, определенных в такой БД, может оказаться необходимым просмотр всей БД.

Иерархическая БД предполагает наличие связей между данными, имеющими какой-либо общий признак. В иерархической БД такие связи могут быть отражены в виде дерева-графа, где возможны только односторонние связи от старших вершин к младшим. Эго ускоряет доступ к необходимой информации, но только если все возможные запросы отражены в структуре дерева. Никакие иные запросы на извлечение информации не будут удовлетворены.

Указанный недостаток снят в сетевой БД, в которой (по крайней мере, теоретически) возможны связи «всех данных со всеми». Поскольку на практике это осуществить невозможно, приходится прибегать к некоторым огра- ничениям. Использование иерархической и сетевой БД ускоряет доступ к информации в базе данных. Каждый элемент данных должен содержать ссылки на некоторые друг ие элементы.

Сведения о некоторых СУБД приведены в таблице.

Название СУБД

Тип БД

MS Access

реляционная

Cache

иерархическая

IDS

сетевая

FoxPro

реляционная

IMS

иерархическая

Oracle

реляционная

Рассмотрим основные понятия и компоненты реляционных БД (например, MS Access), которые в настоящее время имеют наибольшее коммерческое использование.

Реляционная БД ориентирована на организацию данных в виде двумерных таблиц-отношений. Каждая таблица обладает следующими свойствами:

  • • каждый элемент таблицы — это один элемент данных;
  • • все столбцы в таблице однородные, т. е. все элементы в столбце имеют одинаковые длину и гин (числовой, текстовый и т. д.);
  • • каждый столбец имеет уникальное имя;
  • • одинаковые строки в таблице отсутствуют;
  • • порядок следования строк и столбцов может бы ть произвольным.

Таблица — это набор данных по конкретной геме (предметной области), например, сведения о студентах высшего учебного заведения. Данные в таблице располагаются в столбцах (полях) и строках (записях).

Поле — эго элементарная единица логической организации данных, которая соответствует отдельной, неделимой единице информации — атрибуту. Каждому полю дается имя ноля (идентификатор поля внутри записи), например, «Фамилия».

Запись — это совокупность логически связанных нолей.

В реляционном подходе к построению баз данных используется терминология теории отношений. Столбец таблицы со значениями соответствующего атрибута называется доменом, а строка со значениями разных атрибутов — кортежем.

Итак, для реляционных БД существует несколько равноправных терминов: столбец может называться полем или доменом, а строка — записью или кортежем.

Рассмотрим основные возможности реляционной БД MS Access на примере небольшой учебной базы данных. Базу данных можно создавать или в режиме «Таблицы», или в режиме «Конструктор».

При создании новой БД нужно указывать, какой тин данных вводится в данное поле: текстовый, числовой, денежный, логический и т.и. Режим «Конструктор» позволяет детально настроить тины данных, которые заносятся в каждом поле.

На следующем рисунке показан процесс записи данных в режиме «Таблицы».

После заполнения всех полей будет получена таблица, где указаны сведения о пяти студентах. Таблице дадим имя «Студенты».

В режиме конструктора зта таблица выглядит так:

Аналогично можно создать таблицу «Сессия», в которой содержатся оценки студентов но четырём дисциплинам. В ноле «Результат» помещены средние значения оценок студентов но результатам сдачи четырёх экзаменов.

Из примеров видно, что каждое ноле имеет уникальное (единственное в данной таблице) имя. Все поля таблицы «Сессия» имеют числовой тип данных.

Каждая запись должна однозначно идентифицироваться (определяться) уникальным ключом записи. В общем случае ключи записи бывают двух видов: первичный (уникальный) и вторичный.

Первичный ключ — это одно или несколько полей, однозначно идентифицирующих запись. Если первичный ключ состоит из одною поля, он называется простым, если из нескольких полей — составным ключом.

В приведённых выше таблицах простым первичным ключом является атрибут «Зачетка». В таблице «Студенты» можно было попытаться использовать в качестве простого первичного ключа атрибут «Фамилия». Однако не

исключена возможность существования однофамильцев среди студентов. В этом случае атрибут «Фамилия» не сможет шрать роль ключа, однозначно определяющего каждую запись. В качестве ключей часто используют инвентарные, табельные номера, электронные адреса, номера ICQ, паспортные номера и серии или просто порядковые номера записей.

Ключевое ноле задаётся с помощью контекстного меню (щелчок правой кнопкой но выбранному полю в режиме «Конструктор»).

Вторичный ключ — это такое иоле, значение которого может повторяться в нескольких записях, т. е. он не является уникальным. Если но значению первичного ключа может быть найден один-единственный экземпляр записи, го по вторичному ключу — несколько записей.

В реляционной БД содержится, как правило, несколько таблиц с различными сведениями. Разработчик БД может установить связи между отдельными таблицами. При создании связей используют ключевые поля. После установления связей появляется возможность создания запросов, форм и отчетов, в которые помещаются данные из нескольких связанных между собой таблиц.

Пусть в создаваемой базе данных имеется ещё одна таблица с названием «Стипендия», с помощью которой начисляется стипендия в зависимости от среднего балла за сессию (в процентах от максимальной стипендии). Ключевым полем в этой таблице является столбец с названием «Код».

Следующие два рисунка иллюстрируют процесс создания связей между этими тремя таблицами. Вначале нужно на ленте (закладка «Работа с базами данных») выбрать пункт «Схема данных». Затем в открывшемся окне

расположить таблицы и установить связи между одноимёнными полями.

Для отбора данных из БД, удовлетворяющих определенным условиям, создаётся запрос.

Запрос — это инструкция (команда) для манипуляции данными в соответствии с определёнными условиями (критериями). Под манипуляцией понимаются операции выборки только необходимой информации, изменение и обновление записей

Запросы на выборку создаются с помощью «Конструктора запросов» или «Мастера запросов». Например, на вкладке «Создание» можно выбрать пункт «Конструктор запросов» и с помощью диалогового окна «Добавить таблицы» выбрать нужные таблицы и заполнить бланк запроса.

На следующем рисунке показана форма (бланк) запроса-выборки, предназначенного для отбора из созданной БД оценок по математике у студентов группы БТ-61, а на следующем рисунке — результаты сделанной выборки.

Запрос можно формировать с использованием логических (булевых) операций И (AND), ИЛИ (OR), НЕ (NOT). Например, если требуется выбрать из БД сведения о результатах сдачи математики студентами ipyini БТ-61 и БТ-62, то необходимо запрос изменить следующим образом:

В этом случае из БД будут отобраны данные с помощью логической операции ИЛИ и на экране появятся сведения о студентах двух труни — БТ-

61 и БТ-62.

Логическая операция И используется для решения следующей задачи. Пусть требует- ся выбрать из БД фамилии студентов группы БТ-63, сдавших математику с оценкой 5. На следующем рисунке показано, как формируется запрос с использованием логической операции И.

Результаты отбора приведены на следующем рисунке. Рассматриваемые примеры умышленно выбраны простыми, для того чтобы можно было проверить полученный результат даже без использования ЭВМ.

Таблица с результатами запроса может использоваться при дальнейшей обработке данных. В запросе на выборку могут использоваться не только таблицы БД, но и таблицы, полученные в результате выполненных запросов.

В запросах можно производить вычисления. Например, для подсчета среднего балла нужно при формировании запроса вначале просуммировать оценки по четырем предметам, а затем результат разделить на четыре.

Чтобы осуществить отбор записей из базы данных но фамилии (или но имени), нужно в качестве условия отбора использовать запись типа: Like( "Фамилия"):

Форма позволяет отобрать данные из одной или нескольких таблиц и вывести их на экран, используя стандартный или созданный пользователем

макет. При этом формы могут воссоздавать привычные для конечного пользователя документы. Формы используются не только для вывода данных из БД, но также (и, пожалуй, чаще) и для ввода данных. На рисунке представлена форма, позволяющая установить средний балл каждого студента (см. поле «Результат»). Содержание формы изменяется пользователем в зависимости от стоящей перед ним задачи.

Отчёт содержит ту информацию из БД, которая должна быть представлена в виде итогового документа. Обычно отчет представляется в напечатанном на бумаге виде (в отличие от таблиц, запросов и форм, которые чаще всего отображаются лишь на экране дисплея).

 
Посмотреть оригинал
< Пред   СОДЕРЖАНИЕ ОРИГИНАЛ   След >
 

Популярные страницы