Базы и банки данных

1. Основные методы организации и обработки данных

1.1. Основные определения

1.2. Этапы развития средств организации и обработки данных

2. Многоуровневое представление данных

3. Концептуальное моделирование данных

4. Логическое моделирование данных

4.1. Реляционная модель данных

4.2. Основные операции реляционной алгебры

4.3. Переход от ER-диаграмм к системе отношений (таблиц)

4.4. Понятие первичного и внешнего ключа

4.5. Ограничительные условия, поддерживающие целостность

4.6. Аномалии хранения данных

4.7. Функциональная зависимость

4.8. Нормальные формы отношений

5. Элементы пользовательского интерфейса в системе Microsoft Windows

6. Защита данных

7. Языковые средства СУБД

8. Управление параллельным доступом

9. Системы “клиент – сервер”

10. Распределение базы данных

11. Физическая организация БД

12. Администрирование базы данных

13. Выбор СУБД

14. Перспективные направления развития информационных систем

1. Основные методы организации и обработки данных

1.1. Основные определения

Информация – это сведения интересующие пользователя.

Данные – описание какого-либо процесса, объекта или явления которое необходимо зафиксировать.

Модель данных (МД) – это средство обработки данных, позволяющее увидеть не только конкретные значения данных, но и их смысл.

Предметная область – это часть реального мира, которая подлежит изучению с целью организации управления и описания.

База данных (БД) – это совокупность данных о конкретной предметной области.

Объект БД – это элемент предметной области, о котором мы хотим хранить информацию.

Характеристики объекта: Имя, свойства, значение этого свойства.

Схема БД – это совокупность объектов БД и связей между ними.

Модель данных включает в себя 3 основных компонента:

  1. Структура данных.
  2. Множество операций над данными.
  3. Ограничения накладываемые на данные.

Система управления базами данных (СУБД) – это совокупность программных средств, реализующее все 3 компонента модели данных в готовом виде.

1.2. Этапы развития средств организации и обработки данных

Этап 1. Создание индивидуальных подпрограмм доступа и обработки данных каждым разработчиком для своих приложений
программы доступа и обработки данных создавались индивидуально каждым разработчиком для своих приложений.

Этап 2. Появление стандартных библиотек для работы с данными

blank

Этап 3. Появление баз данных, объединяющих данные всей организации, используемые разными приложениями

blank

Развитие СУБД продвигалось в двух направлениях:

  1. Внедрение в имеющиеся языки программирования функций работы с БД.
  2. Автономные системы работы с БД.

Преимущества СУБД:

  1. Сокращение избыточности данных.
  2. Устранение противоречий данных.
  3. Возможность параллельной работы с данными нескольких пользователей.
  4. Возможность соблюдения стандартов предметной области.
  5. Возможность защиты данных.
  6. Независимость данных от программ их обработки.

2. Многоуровневое представление данных

blank

Администратор БД, пользователи различных категорий

Существует 4 модели данных:

  1. Иерархическая.
  2. Сетевая.
  3. Реляционная (данные представлены в виде таблиц).
  4. Внешняя (интерфейс пользователя).

blank

3. Концептуальное моделирование данных

Диаграммы “сущность-связь” (ER-диаграммы).

Основные определения:

Основными компонентами этой модели являются сущности, атрибуты сущности и связи между сущностями.

Сущность – это объект предметной области, о котором необходимо хранить информацию (Например, сущностью является студент).

Атрибут сущности – это параметр, характеризующий сущность (Если студент- это сущность, то атрибутами сущности будут являться Ф.И.О. студента, год его поступления в ВУЗ, возраст, номер зачётной книжки и т.п.).

Связь между сущностями – это ассоциирование между двумя или несколькими сущностями.

Экземпляр сущности – это пример сущности.

Классификация связей между сущностями.

    1. По арности

Арность – это количество сущностей, участвующих в связи.
По арности связи могут быть:

    • Бинарные (2сущности).
    • Тернарные (3 сущности).
    • Унарные (связь сущности с собой).
  1. По значности
  • Один к одному. Это такой вид связи , в котором одному экземпляру первой сущности соответствует один экземпляр второй сущности.

blank

  • Один ко многим (1:m). Это такой вид связи, при котором одному экземпляру первой сущности соответствует несколько экземпляров второй сущности, но не наоборот.

 

blank

  • Многие ко многим (m:m). Это такой вид связи, при котором одному экземпляру первой сущности соответствует несколько экземпляров второй сущности и наоборот.

 

blank

    1. По членству
      • Обязательные
      • Возможные
      • Необязательные

Обязательная связь – это такой вид связи, при котором обе связываемые сущности зависят от наличия связи.

Возможная связь – это такой вид связи, при котором одна из связываемых сущностей зависит от наличия связей.

Необязательная связь – это такой вид связи, при котором обе сущности не зависят от наличия связей.

Сущность может быть подмножеством другой сущности.

blank

4. Логическое моделирование данных

4.1. Реляционная модель данных

Реляционная модель данных – это такая модель данных, в которой данные представлены в виде таблиц.

blank

Основные понятия реляционной МД.

Атомарное значение – неделимое значение.

Домен – множество атомарных значений одного и того же типа. Если значения принадлежат одному и тому же домену, то имеет смысл их сравнение. А1, А5, А7, Аi – атрибуты отношения, т.е. набор значений принадлежащих к одному и тому же домену.

Заголовок (схема отношений) – это набор его атрибутов.

Математическое определение отношений. Если V1, V2…, Vi – это набор множеств именуемых доменами, тогда отношение R (V1, V2, .., Vi) представляет собой подмножество декартовых произведений доменов (V1*V2*…*Vi). Каждому домену приписывается имя, в качестве отношения рассматривается отношение этих имён. Элементом отношения является кортеж.

Кортеж – это множество пар имён атрибутов, значений атрибутов (это строка таблицы).

Мощность отношения – это число его кортежей.

Степень отношения – это число его атрибутов (число столбцов в таблице).

Возможный ключ отношения – это минимальный набор атрибутов, который однозначно определяет кортеж. У ключа есть 2 свойства: уникальность и минимальность.

Уникальность – значения ключевых атрибутов не могут повторяться.

Минимальность – ни один из атрибутов не может быть исключён из набора без нарушения уникальности.

Свойства отношений:

  1. Отношение имеет своё уникальное имя.
  2. Уникальность имён атрибутов.
  3. Отсутствие кортежей-дубликатов.
  4. Атомарность значений атрибутов.
  5. Отсутствие упорядоченности атрибутов и кортежей.

4.2. Основные операции реляционной алгебры

В реляционной алгебре в качестве операндов используются отношения. В результате этих операций возникают новые отношения.

Условные обозначения:

X, Y – отношения-операнды.
R – отношение-результат.
Mx, My, Mr – мощности отношений X,Y,R.
А, B – подмножества схем отношений.

Все операции можно разбить на 2 группы:

  1. Теоретико-множественные.
  2. Операции, учитывающие структуру решений как модель данных.
    1. Объединение.
      R=X+Y
      Max(Mx,My) ≤ Mr ≤ Mx+My
      Схемы кортежей и операндов должны быть одинаковы.
    2. Разность.
      R=X-Y
      0 ≤Mr ≤ Mx
    3. Пересечение
      R=X blank Y=X-(X-Y)
      0 ≤ Mr ≤min(Mx,My)
    4. Декартово произведение.
      R=X*Y
      Mr=Mx*My

X:

A

B

15

7

8

11

1. Основные методы организации и обработки данных

1.1. Основные определения 1.2. Этапы развития средств организации и обработки данных 1.1. Основные определения Информация – это сведения интересующие пользователя. Данные – описание какого-либо процесса, объекта или явления которое необходимо зафиксировать. Модель данных (МД) – это средство обработки данных, позволяющее увидеть не только конкретные значения данных, но и их смысл. Предметная область – это часть […]

Подробнее

10. Распределение базы данных

Все таблицы данных распределяются по сети (узлом), где осуществляется их применение. Каналы между узлами – соединения. Все данные в сети делятся на 2 подвида: Локальные – используются только в своем узле. Глобальные данные – могут использоваться в любом узле. Преимущество: уменьшенное время на доступ наиболее часто используемых программ. рассширяются объемы данных, в которых можно иметь […]

Подробнее

11. Физическая организация БД

Это структура хранения баз данных на физическом носителе. Система физического доступа к базам данных. Стратегический сектор – это программа, которую преобразует запрос в эффективную для исполнения форму. Программа управления буферами – контролирует обмен информации между оперативной памятью и диском. Диспетчер файлов – программа, управляющая размещением файлов на диске. Словарь данных – это часть СУБД, определяющая […]

Подробнее

12. Администрирование базы данных

Задача администрирования: обеспечение выполнения требований конечных пользователей; отслеживает частоту обращений пользователей к базам данных; отслеживает время отклика на их приложения; и администратор обучает пользователей обеспечение защиты целостности базы данных: контроль доступа к БД и контроль обновления данных. Определение процедуры резервного копирования и восстановления; оповещает пользователей о сбое; для предупреждения сбойных систем разрабатывает тесты и анализирует […]

Подробнее

13. Выбор СУБД

Функции СУБД: Словарь данных (системный каталог). Должен обеспечивать: изменение физической записи без влияния на работающие с ними приложения; хранение параметров; централизованное определение; удобные для пользователя язык описания данных и язык манипулирования способы проверки словаря средства создания отчётов Защита и целостность данных: средства ограничения доступа к программам данных контроль параллельной обработки данных управление доступом представления средства […]

Подробнее

14. Перспективные направления развития информационных систем

Линейное программирование (Фортран) Модульное (Паскаль) Объектно-ориентированное (СИ++) Появились объектно-ориентированные БД (ООБД). Основной особенностью является то, что концептуальные модели реализуются напрямую. Любая сущность реализуется в виде объекта, информация о котором хранится в БД. Поведение объекта – это набор значений его атрибутов. Методы – это набор программных средств, оперирующих над состоянием объекта. Класс объектов – это множество […]

Подробнее

2. Многоуровневое представление данных

Администратор БД, пользователи различных категорий Существует 4 модели данных: Иерархическая. Сетевая. Реляционная (данные представлены в виде таблиц). Внешняя (интерфейс пользователя).

Подробнее

3. Концептуальное моделирование данных

Диаграммы “сущность-связь” (ER-диаграммы). Основные определения: Основными компонентами этой модели являются сущности, атрибуты сущности и связи между сущностями. Сущность – это объект предметной области, о котором необходимо хранить информацию (Например, сущностью является студент). Атрибут сущности – это параметр, характеризующий сущность (Если студент- это сущность, то атрибутами сущности будут являться Ф.И.О. студента, год его поступления в ВУЗ, […]

Подробнее

4. Логическое моделирование данных

4.1. Реляционная модель данных 4.2. Основные операции реляционной алгебры 4.3. Переход от ER-диаграмм к системе отношений (таблиц) 4.4. Понятие первичного и внешнего ключа 4.5. Ограничительные условия, поддерживающие целостность 4.6. Аномалии хранения данных 4.7. Функциональная зависимость 4.8. Нормальные формы отношений 4.1. Реляционная модель данных Реляционная модель данных – это такая модель данных, в которой данные представлены […]

Подробнее

5. Элементы пользовательского интерфейса в системе Microsoft Windows

Интерфейс БД – это граница в системе, за которой пользователь ничего не видит. Виды интерфейсов: Консольный интерфейс. Пассивный диалог. Оконный интерфейс. Элементы интерфейса: Меню – это набор команд, из которых мы можем сделать выбор.Различают горизонтальное, вертикальное, комплексное и контекстное меню.Контекстное меню – это меню, которое может появиться в любом месте экрана.Свойства команд меню:— Доступность.— Видимость. […]

Подробнее

6. Защита данных

Защита данных есть комплекс мероприятий, предназначенных для обеспечения целостности, непротиворечивости, безопасности и секретности данных. Непротиворечивость — свойство данных, заключающееся в отсутствии копий данных, находящихся на разных стадиях обновления. Целостность — свойство данных, заключающееся в нахождении значений данных в определенных диапазонах. Например, первичный ключ должен быть уникальным и не пустым. Секретность — свойство данных, заключающееся в […]

Подробнее

7. Языковые средства СУБД

Языковые средства СУБД представляют собой: Язык описания данных (Data Definition Language, DDL) Язык манипулирования данными (Data Manipulation Language, DML) DDL позволяет: Определить структуру данных Определить связи между данными Определить ограничения на данные. DME позволяет описать алгоритмы доступа и обработки данных. Реализации языковых средств СУБД делятся на: Закрытые системы: со свои собственным языком и не работающих […]

Подробнее

8. Управление параллельным доступом

Параллельный доступ — это ситуация, возникающая когда несколько транзакций обращаются к одним данным одновременно. Проблема доступа в том, что необходима полная изолированность пользователей. Изолированность — это создание иллюзии, что каждый пользователь работает с БД самостоятельно. 3 уровня изолированности пользователей: Отсутствие потерянных изменений Транзакция1 Транзакция2 READ A A=A+1 WRITE A COMMIT READ A A=A+1 ROLLBACK ROLLBACK […]

Подробнее

9. Системы “клиент – сервер”

Открытыми системами называются МСЭ.Стандартизированные операционные системы: Windows NT UNJX (удобнее для работы в сети). Свойства открытых систем: Мобильность. Понимают возможность переноса программных средств на другие платформы. Интеропертабельность (способность взаимодействовать) – это возможность создания новых систем на основе имеющихся компонентов со стандартным интерфейсом. Преимущества открытых сетей. Пользователи могут изменять компаненты системы, изменятьее не теряя при этом […]

Подробнее

To top