Теория баз данных и знаний

Теория баз данных и знаний.

Методич. Пособия:

Гедранович В,В теория баз данных и знаний

MS Access 2003 в примерах Голубева Е.А.

Организация и хранение данных в базах данных.

Понятие базы данных (БД), системы управления базами данных (СУБД)

Трехуровневая архитектура баз данных. Модели данных.

Общая характеристика СУБД MS Access.

Информационная система – программно-аппаратный комплекс, который обеспечивает выполнение следующих функция:

Надежное хранение информации в памяти компьютера

Выполнение специфических для данного приложения преобразований информации и вычислений

Предоставление пользователям удобного и легко осваиваемого интерфейса

Классы информационных систем

Документальные системы

Служат для работы с документами на естественном языке (монографии, тексты законодательных актов и др. Консультант, БизнесИнфо)

Фактографические системы

Оперируют фактическими сведениями в виде формализованных записей данных. Системы управления базами данных (СУБД)

База данных – совокупность сведений о конкретных объектах реального мира в какой-либо предметной области

Объектом может быть предмет, вещество, событие, лицо, явление, то есть всё то, что может характеризоваться набором значений некоторой совокупности свойств.

Предметная область – часть реального мира, подлежащая изучению для организации управления и автоматизации.

Представление данных:

Неструктурированное

Структурированное

Структурирование – введение соглашений о способах представления данных.

База данных – это поименованная совокупность структурированных данных, относящихся к определённой предметной области.

БД должна соответствовать следующей системе требований:

Многократное использование

Быстрый поиск и получение информации по запросам

Простота обновления

Уменьшение избыточности данных

Защита от несанкционированного доступа

Защита от уничтожения данных

Максимальная независимость от прикладных программ

СУБД – совокупность языковых и программных средств, предназначенных для создания, ведения и совместного использования БД многими пользователями (FoxPro, bDASE, Microsoft SQL Server, Oracle)

Приложения – программы, с помощью которых пользователи работают с базой данных.

СУБД позволяют:

Создавать БД и работать с ней (открывать, переименовывать, перемещать и т.д)

Редактировать, импортировать и экспортировать данные

Формировать запросы

Проектировать экранные формы для ввода, просмотра, редактирования данных

Формировать и печатать отчеты

Разрабатывать приложения

Публиковать данные в Интернете

Классификация БД по технологии обработки данных

Централизованные БД хранятся в памяти одной вычислительной системы

Распределенные БД состоят из нескольких пересекающихся или даже дублирующих друг друга частей, хранимых в различных ЭВМ компьютерной сети.

Классификация БД по способу доступа к данным

БД с локальных доступом

БД с удалённых доступом

Архитектуры централизованных БД с сетевым доступом:

Файл-сервер – файлы базы данных с файл-сервера передаются для обработки на рабочих станциях.

Клиент-сервер – на центральном компьютере храниться централизованная база данных (сервер базы данных) и осуществляется основная обработка данных.

Трехуровневая архитектура БД. Модели данных.

Трёхуровневая архитектура базы данных

Внешний уровень – представление базы данных с точки зрения пользователя

Концептуальный уровень – обобщающее представление базы данных. Этот уровень описывает логическую структуру всей БД: данные и существующие между ними связи.

Физический уровень – собственно данные расположенные на внешних носителях.

Модель данных – совокупность взаимосвязанных структур данных и операций над этими структурами.

Модели данных

Инфологическая (концептуальных или семантическая) модель отображает реальный мир в некоторые понятные человеку концепции, полностью независимые от параметров среды хранения данных.

Даталогическая модель – отображение инфологической модели на модель данных, используемую в конкретной СУБД.

Физическая модель – реализация даталогической модели средствами выбранной СУБД: создаются объекты БД и связи между ними.

Даталогические модели по способу установления связей между данными различают модели данных:

Иерархическую

Сетевую

Реляционную

Иерархическая модель – строится по принципу иерархии объектов (сегментов). Один тип сегмента является главным, а остальные, находящиеся на низших уровнях иерархии, — подчиненными.

Достоинства:

Простота описания иерархических структур реального мира

Гибкие возможности организации поиска «сверху вниз»

Недостатки:

Дублирование информации

Сетевая модель – структура, у которой любой элемент может быть связан с любым другим без каких-либо ограничений.

Реляционная модель – любое представление данных сводится к совокупности двумерных таблиц особого вида, известного в математике как ОТНОШЕНИЕ.

Основной принцип реляционных структур БД – получение из первичных таблиц новых соответствующей структуры при помощи логических операций.