数据库-范式 「爱情、让人受尽委屈。」 2022-05-26 23:53 219阅读 0赞 作者:Lyken 链接:https://www.zhihu.com/question/24696366/answer/46864498 来源:知乎 著作权归作者所有。商业转载请联系作者获得授权,非商业转载请注明出处。 NF(normal form)作为一个数据库设计里经常会提到的概念,是每一个初学者都应该了解并掌握的。复习数据库的时候发现 *Database System Concepts* 这本书里讲的过于抽象,而且网上也没有特别好的讲解,于是自己重新整理一份,有需者自取。 NF的意义 Normal form作为设计的标准范式,其最大的意义就是为了避免数据的冗余和插入/删除/更新的异常。举个例子 表1 school(*stu-id*,stu-name,major,dean-name,dean-telephone) 在学校这个表里面,学生的学号、姓名、专业、系主任以及系主任电话被放到了一起(典型的excel风格)。虽然这样有些时候也不是不可以,但当进行一些特定操作的时候,着实会给我们带来极大的困扰。 1. 插入异常\[ 输入新信息的时候,系主任电话号码输错 \] : 无法确认系主任的真正号码。 2. 删除异常\[ 某个系的学生全部退学了 \] : 该系对应的系主任名字和电话号码也随之丢失。 3. 更新异常\[ 系主任进行变更 / 系主任换手机号 \] : 我们需要把系里所有学生的行都给更新一遍,显然开销过大。 1NF 定义:所有的属性均有原子性 说人话:所有的属性均不可被再分割,国外比较喜欢拿人名来举例(first,middle,last),但跟国内国情不太符合,我就举一个商品的例子好了。 TaobaoPucharsedLog(*sid*, date, buyer, seller, goods,amount) 显然“商品”会有更多详细的属性,例如商品名称,商品价格,产地等等。“用户”也有昵称,年龄,住址等,“商户”也是如此。这些属性都是可以再分割的,所以并不符合1NF范式,需要将其完全拆至不可分割为止。 修改示范: TaobaoPucharsedLog(*sid*, date, buyer-id, buyer-name, buyer-age, seller, goods, amount) \[仅拆开了buyer\] 意义:嗯.. 这个还是等我们讲完四个定理再来说吧,现在讲解比较困难。 2NF(在满足1NF的前提上) 定义:如果依赖于主键,则需要依赖于所有主键,不能存在依赖部分主键的情况 说人话:对于上面那个例子,TaobaoPucharsedLog(*sid*, date, *buyer-id*, buyer-name, buyer-age, *seller-id*, seller-name, seller-age, *goods-id*, goods-name, amount)。可以看到里面有四个主键:sid, buyer-id, seller-id, goods-id。对于seller-name属性,它仅依赖于seller-id,跟buyer-id之类的没有任何关系,所以它对于主键的依赖是“部分依赖”,并不符合2NF。简单点说,就是不要把不相关的东西放到一个表里面。 修改示范: 拆解成以下四个 1. TaobaoPucharsedLog(*sid*, *buyer-id*, *seller-id*, *goods-id*, amount) 2. BuyerInformation(*buyer-id*, buyer-name, buyer-age) 3. SellerInformation(*seller-id*, seller-name, seller-age) 4. GoodsInformation(*goods-id*, goods-name) 意义:不相关的东西不要放在一起,用多个小表连接来代替大表,减少修改时候的负担。 3NF(在满足1NF和2NF的前提上) 定义:一个数据库表中不包含已在其它表中已包含的非主关键字信息。 说人话:不得存在传递式依赖,比如对于一张数据库,里面的元素有son, person, father, grand-father,依赖关系是son -> person, person -> father, father -> grand-father,明显有一个链表式的传递,3NF中禁止此类依赖的出现。 修改示范: 依赖关系修改为 1. son -> person 2. son -> father 3. son -> grand-father 或者是拆成三张表 (其实就是并查集里面的路径压缩) 意义:避免查询路径过长而导致询问时间过长或者更新异常。以上面的家族关系为例,如果我想查询某位同学曾曾曾曾曾……曾祖父是谁,按照非3NF的依赖,则需要进行多次查询,而对于满足3NF的依赖,只需要进行一次查询。效率大大提高。 ===待续== .. 发现了点问题, 等我码完通识课论文再回来慢慢更新 作者:知乎用户 链接:https://www.zhihu.com/question/24696366/answer/29189700 来源:知乎 著作权归作者所有。商业转载请联系作者获得授权,非商业转载请注明出处。 国内绝大多数院校用的王珊的《数据库系统概论》这本教材,某些方面并没有给出很详细很明确的解释,与实际应用联系不那么紧密,你有这样的疑问也是挺正常的。我教《数据库原理》这门课有几年了,有很多学生提出了和你一样的问题,试着给你解释一下吧。(基本来自于我上课的内容,某些地方为了不过于啰嗦,放弃了一定的严谨,主要是在“关系”和“表”上) 首先要明白”范式(NF)”是什么意思。按照教材中的定义,范式是“符合某一种级别的关系模式的集合,表示一个关系内部各属性之间的联系的合理化程度”。很晦涩吧?实际上你可以把它粗略地理解为**一张数据表的表结构所符合的某种设计标准的级别**。就像家里装修买建材,最环保的是E0级,其次是E1级,还有E2级等等。数据库范式也分为1NF,2NF,3NF,BCNF,4NF,5NF。一般在我们设计关系型数据库的时候,最多考虑到BCNF就够。符合高一级范式的设计,必定符合低一级范式,例如符合2NF的关系模式,必定符合1NF。 接下来就对每一级范式进行一下解释,首先是**第一范式(1NF)。** 符合1NF的关系(你可以理解为数据表。“关系模式”和“关系”的区别,类似于面向对象程序设计中”类“与”对象“的区别。”关系“是”关系模式“的一个实例,你可以把”关系”理解为一张带数据的表,而“关系模式”是这张数据表的表结构。**1NF的定义为:符合1NF的关系中的每个属性都不可再分。表1**所示的情况,就不符合1NF的要求。 \<img src="https://pic4.zhimg.com/50/24afd11455ac34a280fa83e4e8d75ccc\_hd.jpg" data-caption="" data-rawwidth="743" data-rawheight="157" class="origin\_image zh-lightbox-thumb" width="743" data-original="https://pic4.zhimg.com/24afd11455ac34a280fa83e4e8d75ccc\_r.jpg"\> ![24afd11455ac34a280fa83e4e8d75ccc_hd.jpg][] 表1 实际上,**1NF是所有关系型数据库的最基本要求**,你在关系型数据库管理系统(RDBMS),例如SQL Server,Oracle,MySQL中创建数据表的时候,如果数据表的设计不符合这个最基本的要求,那么操作一定是不能成功的。也就是说,只要在RDBMS中已经存在的数据表,一定是符合1NF的。如果我们要在RDBMS中表现表中的数据,就得设计为**表2**的形式: \<img src="https://pic3.zhimg.com/50/6b735fb9503b0930e741faa474fed28e\_hd.jpg" data-caption="" data-rawwidth="881" data-rawheight="136" class="origin\_image zh-lightbox-thumb" width="881" data-original="https://pic3.zhimg.com/6b735fb9503b0930e741faa474fed28e\_r.jpg"\> ![6b735fb9503b0930e741faa474fed28e_hd.jpg][] 表2 但是仅仅符合1NF的设计,仍然会存在数据冗余过大,插入异常,删除异常,修改异常的问题,例如对于**表3**中的设计: \<img src="https://pic1.zhimg.com/50/5b16f655b57a957bfa340d0a996a0eea\_hd.jpg" data-caption="" data-rawwidth="661" data-rawheight="349" class="origin\_image zh-lightbox-thumb" width="661" data-original="https://pic1.zhimg.com/5b16f655b57a957bfa340d0a996a0eea\_r.jpg"\> ![5b16f655b57a957bfa340d0a996a0eea_hd.jpg][] 表3 1. 每一名学生的学号、姓名、系名、系主任这些数据重复多次。每个系与对应的系主任的数据也重复多次——**数据冗余过大** 2. 假如学校新建了一个系,但是暂时还没有招收任何学生(比如3月份就新建了,但要等到8月份才招生),那么是无法将系名与系主任的数据单独地添加到数据表中去的 (注1)——**插入异常** 注1:根据三种关系完整性约束中实体完整性的要求,关系中的码(注2)所包含的任意一个属性都不能为空,所有属性的组合也不能重复。为了满足此要求,图中的表,只能将学号与课名的组合作为码,否则就无法唯一地区分每一条记录。 注2:**码:关系中的某个属性或者某几个属性的组合,用于区分每个元组**(可以把“元组”理解为一张表中的每条记录,也就是每一行)**。** 3. 假如将某个系中所有学生相关的记录都删除,那么所有系与系主任的数据也就随之消失了(一个系所有学生都没有了,并不表示这个系就没有了)。——**删除异常** 4. 假如李小明转系到法律系,那么为了保证数据库中数据的一致性,需要修改三条记录中系与系主任的数据。——**修改异常**。 正因为仅符合1NF的数据库设计存在着这样那样的问题,我们需要提高设计标准,去掉导致上述四种问题的因素,使其符合更高一级的范式(2NF),这就是所谓的“规范化”。 **第二范式(2NF)**在关系理论中的严格定义我这里就不多介绍了(因为涉及到的铺垫比较多),只需要了解2NF对1NF进行了哪些改进即可。其改进是,**2NF在1NF的基础之上,消除了非主属性对于码的部分函数依赖**。接下来对这句话中涉及到的四个概念——**“函数依赖”**、**“码”**、**“非主属性”**、与**“部分函数依赖”**进行一下解释。 **函数依赖** 我们可以这么理解(但并不是特别严格的定义):**若在一张表中,在属性(或属性组)X的值确定的情况下,必定能确定属性Y的值,那么就可以说Y函数依赖于X,写作 X → Y**。也就是说,在数据表中,不存在任意两条记录,它们在X属性(或属性组)上的值相同,而在Y属性上的值不同。这也就是“函数依赖”名字的由来,类似于函数关系 y = f(x),在x的值确定的情况下,y的值一定是确定的。 例如,对于表3中的数据,找不到任何一条记录,它们的学号相同而对应的姓名不同。所以我们可以说**姓名函数依赖于学号**,写作 **学号 → 姓名**。但是反过来,因为可能出现同名的学生,所以有可能不同的两条学生记录,它们在姓名上的值相同,但对应的学号不同,所以我们不能说学号函数依赖于姓名。表中其他的函数依赖关系还有如: * 系名 → 系主任 * 学号 → 系主任 * (学号,课名) → 分数 但以下函数依赖关系则不成立: * 学号 → 课名 * 学号 → 分数 * 课名 → 系主任 * (学号,课名) → 姓名 从“函数依赖”这个概念展开,还会有三个概念: **完全函数依赖** 在一张表中,若 X → Y,且对于 X 的任何一个真子集(假如属性组 X 包含超过一个属性的话),X ' → Y 不成立,那么我们称 Y 对于 X **完全函数依赖**,记作 X F→ Y。(那个F应该写在箭头的正上方,没办法打出来……,正确的写法如**图1**) \<img src="https://pic1.zhimg.com/50/12513de20079d12b99d946072df7311a\_hd.jpg" data-caption="" data-rawwidth="98" data-rawheight="53" class="content\_image" width="98"\> ![12513de20079d12b99d946072df7311a_hd.jpg][] 图1 例如: * 学号 F→ 姓名 * (学号,课名) F→ 分数 (注:因为同一个的学号对应的分数不确定,同一个课名对应的分数也不确定) **部分函数依赖** 假如 Y 函数依赖于 X,但同时 Y 并不完全函数依赖于 X,那么我们就称 Y 部分函数依赖于 X,记作 X P→ Y,如**图2**。 \<img src="https://pic2.zhimg.com/50/10b52b39b18b8ea9fb17b46babf4d20f\_hd.jpg" data-caption="" data-rawwidth="99" data-rawheight="62" class="content\_image" width="99"\> ![10b52b39b18b8ea9fb17b46babf4d20f_hd.jpg][] 图2 例如: * (学号,课名) P→ 姓名 **传递函数依赖** 假如 Z 函数依赖于 Y,且 Y 函数依赖于 X (感谢 @百达 指出的错误,这里改为:『Y 不包含于 X,且 X 不函数依赖于 Y』这个前提),那么我们就称 Z 传递函数依赖于 X ,记作 X T→ Z,如 **图3**。 \<img src="https://pic2.zhimg.com/50/51f8105fbbe92adaa3e343ea2db3bf49\_hd.jpg" data-caption="" data-rawwidth="124" data-rawheight="77" class="content\_image" width="124"\> ![51f8105fbbe92adaa3e343ea2db3bf49_hd.jpg][] 图3 **码** 设 K 为某表中的一个属性或属性组,若除 K 之外的所有属性都完全函数依赖于 K(这个“完全”不要漏了),那么我们称 K 为**候选码**,简称为**码**。在实际中我们通常可以理解为:**假如当 K 确定的情况下,该表除 K 之外的所有属性的值也就随之确定,那么 K 就是码。**一张表中可以有超过一个码。(实际应用中为了方便,通常选择其中的一个码作为**主码**) 例如: 对于表3,**(学号、课名)**这个属性组就是码。该表中有且仅有这一个码。(假设所有课没有重名的情况) **非主属性** 包含在任何一个码中的属性成为主属性。 例如: 对于表3,主属性就有两个,**学号** 与 **课名**。 终于可以回过来看2NF了。首先,我们需要判断,表3是否符合2NF的要求?根据2NF的定义,判断的依据实际上就是看数据表中**是否存在非主属性对于码的部分函数依赖**。若存在,则数据表最高只符合1NF的要求,若不存在,则符合2NF的要求。判断的方法是: 第一步:找出数据表中所有的**码**。 第二步:根据第一步所得到的码,找出所有的**主属性**。 第三步:数据表中,除去所有的主属性,剩下的就都是**非主属性**了。 第四步:查看是否存在非主属性对码的**部分函数依赖**。 对于表3,根据前面所说的四步,我们可以这么做: 第一步: 1. 查看所有每一单个属性,当它的值确定了,是否剩下的所有属性值都能确定。 2. 查看所有包含有两个属性的属性组,当它的值确定了,是否剩下的所有属性值都能确定。 3. …… 4. 查看所有包含了六个属性,也就是所有属性的属性组,当它的值确定了,是否剩下的所有属性值都能确定。 看起来很麻烦是吧,但是这里有一个诀窍,就是假如A是码,那么所有包含了A的属性组,如(A,B)、(A,C)、(A,B,C)等等,都不是码了(因为作为码的要求里有一个“**完全**函数依赖”)。 **图4**表示了表中所有的函数依赖关系: \<img src="https://pic1.zhimg.com/50/51e2689ac9416a91800e63101bee9db7\_hd.jpg" data-caption="" data-rawwidth="541" data-rawheight="212" class="origin\_image zh-lightbox-thumb" width="541" data-original="https://pic1.zhimg.com/51e2689ac9416a91800e63101bee9db7\_r.jpg"\> ![51e2689ac9416a91800e63101bee9db7_hd.jpg][] 图4 这一步完成以后,可以得到,表3的码只有一个,就是**(学号、课名)**。 第二步: 主属性有两个:**学号** 与 **课名** 第三步: 非主属性有四个:**姓名**、**系名**、**系主任**、**分数** **第四步:** 对于**(学号,课名) → 姓名**,有 **学号 → 姓名**,存在非主属性 **姓名** 对码**(学号,课名)**的部分函数依赖。 对于**(学号,课名) → 系名**,有 **学号 → 系名**,存在非主属性 系**名** 对码**(学号,课名)**的部分函数依赖。 对于**(学号,课名) → 系主任**,有 **学号 → 系主任**,存在非主属性 对码**(学号,课名)**的部分函数依赖。 所以表3存在非主属性对于码的部分函数依赖,最高只符合1NF的要求,不符合2NF的要求。 为了让表3符合2NF的要求,我们必须消除这些部分函数依赖,只有一个办法,就是将大数据表拆分成两个或者更多个更小的数据表,在拆分的过程中,要达到更高一级范式的要求,这个过程叫做”模式分解“。模式分解的方法不是唯一的,以下是其中一种方法: 选课(学号,课名,分数) 学生(学号,姓名,系名,系主任) 我们先来判断以下,**选课**表与**学生**表,是否符合了2NF的要求? 对于**选课**表,其码是**(学号,课名)**,主属性是**学号**和**课名**,非主属性是**分数**,**学号**确定,并不能唯一确定**分数**,**课名**确定,也不能唯一确定**分数**,所以不存在非主属性**分数**对于码 **(学号,课名)**的部分函数依赖,所以此表符合2NF的要求。 对于**学生**表,其码是**学号,**主属性是**学号**,非主属性是**姓名、系名**和**系主任**,因为码只有一个属性,所以不可能存在非主属性对于码 的部分函数依赖,所以此表符合2NF的要求。 **图5**表示了模式分解以后的新的函数依赖关系 \<img src="https://pic4.zhimg.com/50/2f4b4a887f6a61674a49d03d79e3fe17\_hd.jpg" data-caption="" data-rawwidth="961" data-rawheight="467" class="origin\_image zh-lightbox-thumb" width="961" data-original="https://pic4.zhimg.com/2f4b4a887f6a61674a49d03d79e3fe17\_r.jpg"\> ![2f4b4a887f6a61674a49d03d79e3fe17_hd.jpg][] 图5 表4表示了模式分解以后新的数据 \<img src="https://pic4.zhimg.com/50/44af74509a4e21372ed372be8560539d\_hd.jpg" data-caption="" data-rawwidth="478" data-rawheight="314" class="origin\_image zh-lightbox-thumb" width="478" data-original="https://pic4.zhimg.com/44af74509a4e21372ed372be8560539d\_r.jpg"\> ![44af74509a4e21372ed372be8560539d_hd.jpg][] 表4 (这里还涉及到一个如何进行模式分解才是正确的知识点,先不介绍了) 现在我们来看一下,进行同样的操作,是否还存在着之前的那些问题? 1. 李小明转系到法律系 只需要修改一次李小明对应的系的值即可。——有改进 2. 数据冗余是否减少了? 学生的姓名、系名与系主任,不再像之前一样重复那么多次了。——有改进 3. 删除某个系中所有的学生记录 该系的信息仍然全部丢失。——无改进 4. 插入一个尚无学生的新系的信息。 因为学生表的码是学号,不能为空,所以此操作不被允许。——无改进 所以说,仅仅符合2NF的要求,很多情况下还是不够的,而出现问题的原因,在于仍然存在非主属性**系主任**对于码**学号**的传递函数依赖。为了能进一步解决这些问题,我们还需要将符合2NF要求的数据表改进为符合3NF的要求。 **第三范式(3NF) 3NF在2NF的基础之上,消除了非主属性对于码的传递函数依赖**。也就是说, 如果存在非主属性对于码的传递函数依赖,则不符合3NF的要求。 接下来我们看看表4中的设计,是否符合3NF的要求。 对于**选课**表,主码为(学号,课名),主属性为**学号**和**课名,**非主属性只有一个,为分数,不可能存在传递函数依赖,所以**选课**表的设计,符合3NF的要求。 对于**学生**表,主码为**学号**,主属性为**学号**,非主属性为**姓名**、**系名**和**系主任**。因为 学号 → 系名,同时 系名 → 系主任,所以存在非主属性**系主任**对于码**学号**的传递函数依赖,所以**学生**表的设计,不符合3NF的要求。。 为了让数据表设计达到3NF,我们必须进一步进行模式分解为以下形式: 选课(学号,课名,分数) 学生(学号,姓名,系名) 系(系名,系主任) 对于**选课**表,符合3NF的要求,之前已经分析过了。 对于**学生**表,码为**学号**,主属性为**学号**,非主属性为**系名**,不可能存在非主属性对于码的传递函数依赖,所以符合3NF的要求。 对于**系**表,码为**系名**,主属性为**系名**,非主属性为**系主任**,不可能存在非主属性对于码的传递函数依赖(至少要有三个属性才可能存在传递函数依赖关系),所以符合3NF的要求。。 新的函数依赖关系如图6 \<img src="https://pic4.zhimg.com/50/5b20707ff3d9afb51ef7bfda726c3e34\_hd.jpg" data-caption="" data-rawwidth="783" data-rawheight="388" class="origin\_image zh-lightbox-thumb" width="783" data-original="https://pic4.zhimg.com/5b20707ff3d9afb51ef7bfda726c3e34\_r.jpg"\> ![5b20707ff3d9afb51ef7bfda726c3e34_hd.jpg][] 图6 新的数据表如表5 \<img src="https://pic1.zhimg.com/50/8bca802bcff92a8945bf808d18d7ec62\_hd.jpg" data-caption="" data-rawwidth="470" data-rawheight="419" class="origin\_image zh-lightbox-thumb" width="470" data-original="https://pic1.zhimg.com/8bca802bcff92a8945bf808d18d7ec62\_r.jpg"\> ![8bca802bcff92a8945bf808d18d7ec62_hd.jpg][] 表5 现在我们来看一下,进行同样的操作,是否还存在着之前的那些问题? 1. 删除某个系中所有的学生记录 该系的信息不会丢失。——有改进 2. 插入一个尚无学生的新系的信息。 因为系表与学生表目前是独立的两张表,所以不影响。——有改进 3. 数据冗余更加少了。——有改进 **结论** 由此可见,符合3NF要求的数据库设计,**基本**上解决了数据冗余过大,插入异常,修改异常,删除异常的问题。当然,在实际中,往往为了性能上或者应对扩展的需要,经常 做到2NF或者1NF,但是作为数据库设计人员,至少应该知道,3NF的要求是怎样的。 ==============时隔半年,终于决定把这个坑填上,来晚了 =========== **BCNF范式** 要了解 BCNF 范式,那么先看这样一个问题: 若: 1. 某公司有若干个仓库; 2. 每个仓库只能有一名管理员,一名管理员只能在一个仓库中工作; 3. 一个仓库中可以存放多种物品,一种物品也可以存放在不同的仓库中。每种物品在每个仓库中都有对应的数量。 那么关系模式 仓库(仓库名,管理员,物品名,数量) 属于哪一级范式? 答:已知函数依赖集:仓库名 → 管理员,管理员 → 仓库名,(仓库名,物品名)→ 数量 码:(管理员,物品名),(仓库名,物品名) 主属性:仓库名、管理员、物品名 非主属性:数量 ∵ 不存在非主属性对码的部分函数依赖和传递函数依赖。∴ 此关系模式属于3NF。 基于此关系模式的关系(具体的数据)可能如图所示: \<img src="https://pic4.zhimg.com/50/68d080d437732aad8cfe451b427849d6\_hd.jpg" data-caption="" data-rawwidth="625" data-rawheight="296" class="origin\_image zh-lightbox-thumb" width="625" data-original="https://pic4.zhimg.com/68d080d437732aad8cfe451b427849d6\_r.jpg"\> ![68d080d437732aad8cfe451b427849d6_hd.jpg][] 好,既然此关系模式已经属于了 3NF,那么这个关系模式是否存在问题呢?我们来看以下几种操作: 1. 先新增加一个仓库,但尚未存放任何物品,是否可以为该仓库指派管理员?——不可以,因为物品名也是主属性,根据实体完整性的要求,主属性不能为空。 2. 某仓库被清空后,需要删除所有与这个仓库相关的物品存放记录,会带来什么问题?——仓库本身与管理员的信息也被随之删除了。 3. 如果某仓库更换了管理员,会带来什么问题?——这个仓库有几条物品存放记录,就要修改多少次管理员信息。 从这里我们可以得出结论,在某些特殊情况下,即使关系模式符合 3NF 的要求,仍然存在着插入异常,修改异常与删除异常的问题,仍然不是 ”好“ 的设计。 造成此问题的原因:存在着**主属性**对于码的部分函数依赖与传递函数依赖。(在此例中就是存在主属性【仓库名】对于码【(管理员,物品名)】的部分函数依赖。 解决办法就是要在 3NF 的基础上消除**主属性**对于码的部分与传递函数依赖。 仓库(仓库名,管理员) 库存(仓库名,物品名,数量) 这样,之前的插入异常,修改异常与删除异常的问题就被解决了。 以上就是关于 BCNF 的解释。 最近身体不太舒服,写不动了。有空再放几个典型习题及其解答吧。 =============================== 问题1: [李德竹][Link 1] :老师您好,我看了您关于数据库范式的回答,有一点不太理解,就是关于码的定义,如果除K之外的所有属性都完全函数依赖于K时才能称K为码,那么在判断2NF时又怎么会存在非主属性对码的部分函数依赖这种情况?希望老师有时间能指点一下,谢谢 我 :在“码”的定义中,除 K 之外的所有属性应该看成是一个集合 U(也就是一个整体),也就是说,只有 K 能够完全函数决定 U 中的每一个属性,那么 K 才是码。如果 K 只是能够完全函数决定 U 中的一部分属性,而不能完全函数决定另外一部分属性,那么 K 不是码。 比如有关系模式 R (Sno, Sname, Cno, Cname, Sdept, Sloc, Grade),其中函数依赖集为 F= \{ Sno → Sname, Sno → Sdept, Sdept → Sloc,Sno → Sloc, Cno → Cname, (Sno, Cno) → Grade \} 那么 R 中的码只能是 (Sno, Cno),Sno 或 Cno 并不能完全函数决定除 Sno / Cno 之外的所有其他属性(其实就是不能决定 Grade ),所以单独的 Sno 与 Cno 并不能作为码。 所以可得到主属性:Sno, Cno 非主属性:Sname, Cname, Sdept, Sloc, Grade R 中存在非主属性 Cname 对于码 (Sno, Cno) 的部分函数依赖 (Cno → Cname) 。(还有很多别的例子就不一一列举了)。所以 R 不符合 2NF 的要求。 ======================================== 花了好几天断断续续写了这个答案,累死我了。看有不少人对此有疑问,干脆写一个详细点的,希望成为这个知识点的权威回答……如果有一些细节方面的问题,比如表达上,还会进行修改,大的方面,肯定是没错的。 [24afd11455ac34a280fa83e4e8d75ccc_hd.jpg]: /images/20220527/1ec3801b6df24f22ad019725afe5ff7c.png [6b735fb9503b0930e741faa474fed28e_hd.jpg]: /images/20220527/9b81fed16c7f438185f25602aee79a14.png [5b16f655b57a957bfa340d0a996a0eea_hd.jpg]: /images/20220527/b790cdd8707b40f8abf0dc4c014b39cd.png [12513de20079d12b99d946072df7311a_hd.jpg]: /images/20220527/31380d1c478a4789af84a8b5a2450a55.png [10b52b39b18b8ea9fb17b46babf4d20f_hd.jpg]: /images/20220527/c452025e1b0c44438c35bca03e722e74.png [51f8105fbbe92adaa3e343ea2db3bf49_hd.jpg]: /images/20220527/61f467491ca54445a1853bb4b34abb9d.png [51e2689ac9416a91800e63101bee9db7_hd.jpg]: /images/20220527/3edd6764cf8a41098c0e97247f4124c2.png [2f4b4a887f6a61674a49d03d79e3fe17_hd.jpg]: /images/20220527/109bcf345682430dbde97313c0f1c93a.png [44af74509a4e21372ed372be8560539d_hd.jpg]: /images/20220527/730a01af739a44ff891095c362a568d3.png [5b20707ff3d9afb51ef7bfda726c3e34_hd.jpg]: /images/20220527/c5c5a0ec9c7d4b3e859ce4980a94bfcc.png [8bca802bcff92a8945bf808d18d7ec62_hd.jpg]: /images/20220527/d295f9ad91834b57adb602a5b0c32d05.png [68d080d437732aad8cfe451b427849d6_hd.jpg]: /images/20220527/e045f00112b946cfa951669e60942fb0.png [Link 1]: http://www.zhihu.com/people/li-de-zhu-84
相关 数据库范式 读书的时候,上数据库课,一开头就讲范式。一直搞不懂这个范式,也不清楚是做什么的。 其实,范式跟我们数据库的表设计息息相关。或者这么说,其实我们许多时候基本都懂得怎么设计表,实 旧城等待,/ 2022年12月31日 06:29/ 0 赞/ 126 阅读
相关 数据库--范式 1.第一范式(1NF):每一个分量必须是不可分的数据项 如果数据库表中的所有字段值都是不可分解的原子值 2.完全依赖:X决定Y,但是X的任何一个真子集都都不能决定Y 本是古典 何须时尚/ 2022年08月21日 14:52/ 0 赞/ 190 阅读
相关 数据库范式 设计关系数据库时,遵从不同的规范要求,设计出合理的关系型数据库,这些不同的规范要求被称为不同的范式,各种范式呈递次规范,越高的范式数据库冗余越小。 目前关系数据库有六种范式: 柔情只为你懂/ 2022年07月13日 08:17/ 0 赞/ 177 阅读
相关 数据库范式 范式:Normal Form (NF) 第一范式-1NF:列的原子性,即列不能再拆分,一个列只表示一个意思。 第二范式-2NF:首先满足1NF,然后,所有的非主键必须完 灰太狼/ 2022年07月10日 15:28/ 0 赞/ 190 阅读
相关 数据库范式 1.基本概念 实体:现实世界中客观存在并可以被区别的事物。 属性:实体所具有的某一特性。 元组:表中的一行就是一个元组。 码:表中可以唯一确定一个元组的某个属性( 今天药忘吃喽~/ 2022年06月11日 04:57/ 0 赞/ 201 阅读
相关 数据库-范式 作者:Lyken 链接:https://www.zhihu.com/question/24696366/answer/46864498 来源:知乎 著作权归作者所有 「爱情、让人受尽委屈。」/ 2022年05月26日 23:53/ 0 赞/ 220 阅读
相关 数据库范式 数据库范式 第一范式(1NF):强调的是列的原子性,即列不能够再分成其他几列。 第二范式(2NF):首先是 1NF,另外包含两部分内容,一是表必须有一个主键;二是没有包 怼烎@/ 2022年05月26日 11:48/ 0 赞/ 189 阅读
相关 数据库范式 数据库范式 第一范式(1NF):强调的是列的原子性,即列不能够再分成其他几列。 第二范式(2NF):首先是 1NF,另外包含两部分内容,一是表必须有主键;二是没有包含在 布满荆棘的人生/ 2022年04月08日 15:48/ 0 赞/ 262 阅读
相关 数据库范式 多值依赖的定义: 设R(U)是一个属性集合U上的一个关系模式,X, Y, 和Z是U的子集,并且Z=U-X-Y,多值依赖X->->Y成立当且仅当对R的任一个关系r, 比眉伴天荒/ 2022年02月19日 23:22/ 0 赞/ 354 阅读
相关 数据库范式 > 设计关系数据库时,遵从不同的规范要求,设计出合理的关系型数据库,这些不同的规范要求被称为不同的范式,各种范式呈递次规范,越高的范式数据库冗余越小。 目前关系数据库有六种范 淡淡的烟草味﹌/ 2021年09月22日 20:42/ 0 赞/ 434 阅读
还没有评论,来说两句吧...