写在前面:绪论很重要,学之可得知识脉络,理清框架、导图。

初步讲解数据库基本概念,介绍数据模型的组成要素和常用的数据模型、数据库系统的三级模式结构和数据库系统的主要组成部分。

1.1 数据库系统概述

先给出数据库最常用的术语和基本概念。

1.1.1 数据库的4个基本概念

概念1:数据(data)

地位:数据是数据库中存储的基本对象。

基本定义:描述事物的符号记录称为数据。

补充扩展:数据与语义不可分割。


概念2:数据库(DataBase,DB)

简明定义:数据库就是存放数据的仓库。

严格定义:数据库是长期存储在计算机内、有组织的、可共享的大量数据的集合。

何为有组织? 数据库中的数据按照一定的数据模型组织、描述和存储,具有较小的冗余度、较高的数据独立性易扩展性


概念3:数据库管理系统(DataBase Management System,DBMS)

基本定义:数据库操作系统是位于用户和操作系统之间的一层数据管理软件,是一个大型的软件系统。

基本功能

  • 数据定义:提供数据定义语言(Data Definition Language,DDL),便于对数据对象的组成和结构进行定义。
  • 数据组织、存储和管理:对不同数据进行分类管理,确定这些数据在存储级上的文件结构和存取方式。
    
  • 数据操纵功能:提供数据操纵语言(Data Manipulation Language,DML),利用其可以实现对数据库的基本操作(增删查改)
  • 数据库的事务管理和运行管理:数据库在建立、运行、维护时的管理和控制。
    
  • 数据库的建立和维护功能:数据库初始数据的输入、转换功能,数据库的转储、恢复功能等。
  • 其他功能:数据库管理系统与其他软件系统的通信、不同数据库管理系统之间的数据转换等。

概念4:数据库系统(DataBase Syetem,DBS)

基本概念:数据库系统是由数据库数据库管理系统(及其应用开发工具)应用程序数据库管理员DBA)组成的存储、管理、处理和维护数据的系统。

下图给出了数据库系统的结构:

上图是一张很重要的结构图,一定记住。如图所示,数据库提供数据的存储功能,数据库管理系统提供数据的组织、存取、管理和维护功能,数据库管理员负责全面管理数据库系统。用户需要借助应用软件与数据库管理系统交互。

1.1.2 数据管理技术的产生与发展

三个阶段:人工管理、文件系统、数据库系统。

从文件系统到数据库系统标志着数据管理技术的飞跃。

1.1.3 数据库系统的特点

  1. 数据结构化
    数据库系统实现整体数据的结构化,这是其与文件系统的本质区别。所谓整体结构性就是指数据库中的数据不再仅仅针对某一个应用,而是面向整个组织;不仅数据内部结构化,整体也是结构化的。

  2. 数据的共享性高、冗余度低且易于扩充。
    由于数据的整体结构化,提高了数据的可共享性,从而减少数据冗余,节约存储空间。且易于增加新的应用,易于扩充。

  3. 数据独立性高
    包括物理独立性逻辑独立性。物理独立性指的是数据在数据库里如何存储只与数据库管理系统有关,与用户无关。逻辑独立性指的是应用程序与数据库的逻辑结构也是独立的。

  4. 数据由数据库管理系统统一管理和控制

1.2 数据模型

数据模型是对现实世界数据特征的抽象。
现在的数据库均是基于某种数据模型的,数据模型是数据库系统的核心和基础。

1.2.1 两类数据模型

下面介绍两类数据模型:概念模型、逻辑模型和物理模型。

为什么要分为多类数据模型?因为一种数据模型很难全面满足要求。就像在建筑和施工上,不同阶段有不同图纸,在开发实施数据库应用系统是也需要使用不同的数据模型。

下面我们使用一张图来介绍一下这几种不同数据模型的作用。

其中,现实世界抽象为概念模型是由数据库设计人员进行;概念模型到逻辑模型由设计人员和设计工具协同完成;最后的逻辑模型到物理模型完全由数据库管理系统实现。

1.2.2 概念模型

概念模型可以看作是一个承上启下的中间层,数据库设计人员可以使用它进行数据库设计,也可以通过它与用户进行交流。概念模型具有较强的语义表达能力,同时简单、清晰,易于理解。

信息世界的基本概念

  • 实体(Entity):客观存在的相互区别的事物。
  • 属性(Attribute):实体具有的某一特征。
  • 码(Key):唯一标识实体的属性集合。
  • 域(Domain):属性的取值范围。
  • 实体型:同类实体称为实体型。
  • 实体集:同类型实体的集合。
  • 联系:一对一、一对多、多对多。联系本身也是一个实体型,也可以具有属性

概念模型的一种表示方法:实体-联系方法

最常用的概念模型的表示方法就是实体-联系方法,该方法使用E-R图来描述。
矩形表示实体集、菱形表示联系、椭圆形表示属性。

  • 特别对于多对多、多个实体之间的E-R图表示,要学会描述各个实体之间的联系,理清数字关系。
  • 对于一个实体内部之间的联系也要注意。例如:职工内部干部领导其他职工。

下面来一个E-R图示例:(关键在于确定实体之间的联系)

  • 先分析:

  • 再画图:

  • 最后重点:(确定联系对值)

仓库和职工是1对多联系,至于如何确定:想着一个仓库有多个职工,确认一边;一个职工只能负责一个仓库,确定另一边

1.2.3 数据模型的组成要素

数据模型是严格定义的一组概念的集合。其组成要素有以下三部分。

  • 数据结构
  • 数据操作
  • 数据的完整性约束条件

1.2.4 常用的数据模型

  • 层次模型
  • 网状模型
  • 关系模型
  • 面型对象数据模型
  • 对象关系数据模型
  • 半结构化数据模型

关系模型概述:

定义:关系模型是指用二维表的形式表示实体和实体间联系的数据模型。

示例

术语表述

  • 关系:一个关系对应通常说的一张表。
  • 属性:表中的一列即为一个属性。
  • 域:一组具有相同数据类型的值的集合。
  • 元组:表中的每一行即为一个元组。
  • 码:表中的某个属性组,可以唯一的确定一个元组。
  • 分量:元组的一个属性值。
  • 关系模式:对关系的描述。关系名(属性1,属性2.。。属性n)

1.3 数据库系统的结构

1.3.1 数据库系统模式的概念

  • 模式:数据库中全体数据的逻辑结构和特征的描述。
  • 实例:模式的一个具体值。

模式是相对稳定的,而实例是相对变动的。模式反映数据的结构与联系,实例反映数据库某一时刻的状态。

1.3.2 数据库系统的三级模式结构

所有的数据库管理系统在体系结构上具有相同的特征,即三级模式结构

下图给出了三级模式结构的示意图:

模式介绍

外模式介绍

内模式介绍

1.3.2 数据库的二级映像功能与数据独立性

为了实现数据库系统三种抽象层次的联系和转换,提供了两层映像。

  1. 外模式/模式映像
    模式描述数据的全局逻辑结构,外模式描述局部逻辑结构。而这个映像定义了外模式和模式之间的对应关系,一般包含在各自外模式的描述中。这个映像保证了数据和程序的逻辑独立性
  2. 模式/内模式映像
    内模式描述了数据的物理结构和存储方式。这个映像是唯一的,保证了数据和程序的物理独立性

1.4 数据库系统的组成

  1. 硬件平台及数据库

  2. 软件

  3. 人员

1.5 小结