0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

列表解释关系模型

数据分析与开发 来源:数据分析与开发 作者:数据分析与开发 2020-09-24 15:04 次阅读

关系模型(Relational model)由 E.F.Codd 博士于 1970 年提出,以集合论中的关系概念为基础;无论是现实世界中的实体对象还是它们之间的联系都使用关系表示。我们在数据库系统中看到的关系就是二维表(Table),由行(Row)和列(Column)组成。因此,也可以说关系表是由数据行构成的集合。

关系模型由数据结构、关系操作、完整性约束三部分组成。

关系模型中的数据结构就是关系表,包括基础表、派生表(查询结果)和虚拟表(视图)。

常用的关系操作包括增加、删除、修改和查询(CRUD),使用的就是 SQL 语言。其中查询操作最为复杂,包括选择(Selection)、投影(Projection)、并集(Union)、交集(Intersection)、差集(Exception)以及笛卡儿积(Cartesian product)等。

完整性约束用于维护数据的完整性或者满足业务约束的需求,包括实体完整性(主键约束)、参照完整性(外键约束)以及用户定义的完整性(非空约束、唯一约束、检查约束和默认值)。

我们今天的主题是关系操作语言,也就是 SQL。本文使用的示例数据来源于https://blog.csdn.net/horses/article/details/86518676。

面向集合

SQL(结构化查询语言)是操作关系数据库的标准语言。SQL 非常接近英语,使用起来非常简单。它在设计之初就考虑了非技术人员的使用需求,我们通常只需说明想要的结果(What),而将数据处理的过程(How)交给数据库管理系统。所以说,SQL 才是真正给人用的编程语言! 接下来我们具体分析一下关系的各种操作语句;目的是为了让大家能够了解SQL 是一种面向集合的编程语言,它的操作对象是集合,操作的结果也是集合。

在关系数据库中,关系、表、集合三者通常表示相同的概念。

SELECT

下面是一个简单的查询语句:

SELECT employee_id, first_name, last_name, hire_dateFROMemployees; 它的作用就是从 employees 表中查询员工信息。显然,我们都知道 FROM 之后是一个表(关系、集合)。不仅如此,整个查询语句的结果也是一个表。所以,我们可以将上面的查询作为表使用:

SELECT * FROM (SELECT employee_id, first_name, last_name, hire_dateFROMemployees)t; 括号内的查询语句被称为派生表,我们给它指定了一个别名叫做 t。同样,整个查询结果也是一个表;这就意味着我们可以继续嵌套,虽然这么做很无聊。 我们再看一个 PostgreSQL 中的示例:

-- PostgreSQLSELECT * FROM upper('sql');| upper ||-------||SQL| upper() 是一个大写转换的函数。它出现再 FROM 子句中,意味着它的结果也是一个表,只不过是 1 行 1 列的特殊表。 SELECT 子句用于指定需要查询的字段,可以包含表达式、函数值等。SELECT 在关系操作中被称为投影(Projection),看下面的示意图应该就比较好理解了。

除了 SELECT 之外,还有一些常用的 SQL 子句。 WHERE 用于指定数据过滤的条件,在关系运算中被称为选择(Selection),示意图如下:

ORDER BY 用于对查询的结果进行排序,示意图如下:

总之,SQL 可以完成各种数据操作,例如过滤、分组、排序、限定数量等;所有这些操作的对象都是关系表,结果也是关系表。

在这些关系操作中,有一个比较特殊,就是分组。

GROUP BY

分组( GROUP BY)操作和其他的关系操作不同,因为它改变了关系的结构。来看下面的示例:

SELECT department_id, count(*), first_name FROM employeesGROUPBYdepartment_id; 该语句的目的是按照部门统计员工的数量,但是存在一个语法错误,就是 first_name 不能出现在查询列表中。原因在于按照部门进行分组的话,每个部门包含多个员工;无法确定需要显示哪个员工的姓名,这是一个逻辑上的错误。 所以说,GROUP BY 改变了集合元素(数据行)的结构,创建了一个全新的关系。分组操作的示意图如下:

尽管如此,GROUP BY 的结果仍然是一个集合。

UNION

SQL 面向集合特性最明显的体现就是 UNION(并集运算)、INTERSECT(交集运算)和 EXCEPT/MINUS(差集运算)。 这些集合运算符的作用都是将两个集合并成一个集合,因此需要满足以下条件:

两边的集合中字段的数量和顺序必须相同;

两边的集合中对应字段的类型必须匹配或兼容。

具体来说,UNION 和 UNION ALL 用于计算两个集合的并集,返回出现在第一个查询结果或者第二个查询结果中的数据。它们的区别在于 UNION 排除了结果中的重复数据,UNION ALL 保留了重复数据。下面是 UNION 操作的示意图:

INTERSECT 操作符用于返回两个集合中的共同部分,即同时出现在第一个查询结果和第二个查询结果中的数据,并且排除了结果中的重复数据。INTERSECT 运算的示意图如下:

EXCEPT 或者 MINUS 操作符用于返回两个集合的差集,即出现在第一个查询结果中,但不在第二个查询结果中的记录,并且排除了结果中的重复数据。EXCEPT 运算符的示意图如下:

除此之外,DISTINCT 运算符用于消除重复数据,也就是排除集合中的重复元素。

SQL 中的关系概念来自数学中的集合理论,因此 UNION、INTERSECT 和 EXCEPT 分别来自集合论中的并集(∪cup∪)、交集(∩cap∩)和差集(∖setminus∖)运算。需要注意的是,集合理论中的集合不允许存在重复的数据,但是 SQL 允许。因此,SQL 中的集合也被称为多重集合(multiset);多重集合与集合理论中的集合都是无序的,但是 SQL 可以通过 ORDER BY 子句对查询结果进行排序。

JOIN

在 SQL 中,不仅实体对象存储在关系表中,对象之间的联系也存储在关系表中。因此,当我们想要获取这些相关的数据时,需要使用到另一个操作:连接查询(JOIN)。 常见的 SQL连接查类型包括内连接、外连接、交叉连接等。其中,外连接又可以分为左外连接、右外连接以及全外连接。 内连接(Inner Join)返回两个表中满足连接条件的数据,内连接的原理如下图所示:

左外连接(Left Outer Join)返回左表中所有的数据;对于右表,返回满足连接条件的数据;如果没有就返回空值。左外连接的原理如下图所示:

右外连接(Right Outer Join)返回右表中所有的数据;对于左表,返回满足连接条件的数据,如果没有就返回空值。右外连接与左外连接可以互换,以下两者等价:

t1 RIGHT JOIN t2t2LEFTJOINt1 全外连接(Full Outer Join)等价于左外连接加上右外连接,同时返回左表和右表中所有的数据;对于两个表中不满足连接条件的数据返回空值。全外连接的原理如下图所示:

交叉连接也称为笛卡尔积(Cartesian Product)。两个表的交叉连接相当于一个表的所有行和另一个表的所有行两两组合,结果的数量为两个表的行数相乘。交叉连接的原理如下图所示:

其他类型的连接还有半连接(SEMI JOIN)、反连接(ANTI JOIN)。

集合操作将两个集合合并成一个更大或更小的集合;连接查询将两个集合转换成一个更大或更小的集合,同时获得了一个更大的元素(更多的列)。很多时候集合操作都可以通过连接查询来实现,例如:

SELECT department_id FROM departments UNIONSELECT department_idFROMemployees; 等价于:

SELECT COALESCE(d.department_id, e.department_id) FROM departments dFULLJOINemployeeseON(e.department_id=d.department_id); 我们已经介绍了许多查询的示例,接下来看看其他的数据操作。

DML

DML 表示数据操作语言,也就是插入、更新和删除。以下是一个插入语句示例:

CREATE TABLE test(id int); -- MySQL、SQL Server 等INSERT INTO test(id) VALUES (1),(2),(3); -- OracleINSERT INTO test(id)(SELECT 1 AS id FROM DUALUNION ALLSELECT 2 FROM DUALUNION ALLSELECT3FROMDUAL); 我们通过一个 INSERT 语句插入了 3 条记录,或者说是插入了一个包含 3 条记录的关系表。因为,UNION ALL 返回的是一个关系表。VALUES 同样是指定了一个关系表,在 SQL Server 和 PostgreSQL 中支持以下语句:

SELECT *FROM ( VALUES(1),(2),(3))test(id); 前面我们已经说过,FROM 之后是一个关系表,所以这里的 VALUES 也是一样。由于我们经常插入单条记录,并没有意识到实际上是以表为单位进行操作。 同样,UPDATE 和 DELETE 语句也都是以关系表为单位的操作;只不过我们习惯了说更新一行数据或者删除几条记录。

原文标题:图解 SQL,这也太形象了吧!

文章出处:【微信公众号:数据分析与开发】欢迎添加关注!文章转载请注明出处。

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • SQL
    SQL
    +关注

    关注

    1

    文章

    760

    浏览量

    44074
  • 关系模型
    +关注

    关注

    0

    文章

    3

    浏览量

    5703

原文标题:图解 SQL,这也太形象了吧!

文章出处:【微信号:DBDevs,微信公众号:数据分析与开发】欢迎添加关注!文章转载请注明出处。

收藏 人收藏

    评论

    相关推荐

    什么是大模型、大模型是怎么训练出来的及大模型作用

    ,基础模型。   大模型是一个简称,完整的叫法,应该是“人工智能预训练大模型”。预训练,是一项技术,我们后面再解释。   我们现在口头上常说的大模型
    的头像 发表于 11-25 09:29 52次阅读
    什么是大<b class='flag-5'>模型</b>、大<b class='flag-5'>模型</b>是怎么训练出来的及大<b class='flag-5'>模型</b>作用

    Llama 3 与开源AI模型关系

    在人工智能(AI)的快速发展中,开源AI模型扮演着越来越重要的角色。它们不仅推动了技术的创新,还促进了全球开发者社区的合作。Llama 3,作为一个新兴的AI项目,与开源AI模型关系密切,这种
    的头像 发表于 10-27 14:42 315次阅读

    AI大模型与深度学习的关系

    AI大模型与深度学习之间存在着密不可分的关系,它们互为促进,相辅相成。以下是对两者关系的介绍: 一、深度学习是AI大模型的基础 技术支撑 :深度学习是一种机器学习的方法,通过多层神经网
    的头像 发表于 10-23 15:25 371次阅读

    基于TPS61094的长寿命、低成本智能电表解决方案

    电子发烧友网站提供《基于TPS61094的长寿命、低成本智能电表解决方案.pdf》资料免费下载
    发表于 09-24 10:47 1次下载
    基于TPS61094的长寿命、低成本智能电<b class='flag-5'>表解</b>决方案

    鸿蒙跨端实践-长列表解决方案和性能优化

    这是我参加创作者计划的第一篇文章。 前言 长列表是前端和客户端应用中最常见的业务场景,比如商品瀑布流等,有成千上万条数据,因此长列表的渲染性能在iOS,Android,Harmony,Web等各大
    的头像 发表于 09-23 15:26 328次阅读
    鸿蒙跨端实践-长<b class='flag-5'>列表解</b>决方案和性能优化

    MSPM0 L1测量仪表解决方案指南

    电子发烧友网站提供《MSPM0 L1测量仪表解决方案指南.pdf》资料免费下载
    发表于 09-04 10:47 1次下载
    MSPM0 L1测量仪<b class='flag-5'>表解</b>决方案指南

    ai大模型和ai框架的关系是什么

    AI大模型和AI框架是人工智能领域中两个重要的概念,它们之间的关系密切且复杂。 AI大模型的定义和特点 AI大模型是指具有大量参数的深度学习模型
    的头像 发表于 07-16 10:07 4w次阅读

    AI大模型与AI框架的关系

    在探讨AI大模型与AI框架的关系时,我们首先需要明确两者的基本概念及其在人工智能领域中的角色。AI大模型通常指的是具有极大规模、高度复杂性和强大能力的人工智能系统,它们能够处理复杂的任务和数据,并在
    的头像 发表于 07-15 11:42 931次阅读

    知识图谱与大模型之间的关系

    在人工智能的广阔领域中,知识图谱与大模型是两个至关重要的概念,它们各自拥有独特的优势和应用场景,同时又相互补充,共同推动着人工智能技术的发展。本文将从定义、特点、应用及相互关系等方面深入探讨知识图谱与大模型之间的
    的头像 发表于 07-10 11:39 886次阅读

    人工智能与大模型关系与区别

    在科技日新月异的今天,人工智能(AI)已成为推动社会进步的重要力量。而在人工智能的众多分支中,大模型(Large Models)作为近年来兴起的概念,以其巨大的参数数量和强大的计算能力,在多个领域展现出了非凡的潜力。本文旨在深入探讨人工智能与大模型之间的
    的头像 发表于 07-04 16:07 3370次阅读

    【大规模语言模型:从理论到实践】- 阅读体验

    直观地解释和理解。这可能会影响模型的可解释性和可信赖性,特别是在需要高度可靠性的场景中。 通过修改注意力机制的计算方式或引入新的架构来降低计算复杂度和内存消耗;通过引入正则化技术来提高模型
    发表于 06-07 14:44

    【大语言模型:原理与工程实践】大语言模型的评测

    。评测任务涵盖了词义理解、语义理解、阅读理解、拼音理解以及古文及谚语理解等五大类别。在词义理解方面,我们要求模型解释成语“画龙点睛”的含义,并区分“爱护”与“爱戴”之间的差异。在语义理解环节,我们测试
    发表于 05-07 17:12

    【大语言模型:原理与工程实践】核心技术综述

    的复杂模式和长距离依赖关系。 预训练策略: 预训练是LLMs训练过程的第一阶段,模型在大量的文本数据上学习语言的通用表示。常用的预训练任务包括遮蔽语言建模(Masked Language
    发表于 05-05 10:56

    osi参考模型与TCP/IP参考模型的对应关系

    OSI参考模型是一种将计算机网络协议分解成七个不同层次的概念模型。这七个层次分别是物理层、数据链路层、网络层、传输层、会话层、表示层和应用层。每一层都负责不同的任务和功能,通过这种分层的方式,可以
    的头像 发表于 01-11 14:26 5681次阅读

    AD630的Pspice仿真模型只有16pin,与实物的20pin的对应关系是什么?

    AD630的Pspice仿真模型只有16pin,与实物的20pin的对应关系是什么?
    发表于 12-14 06:22