SQL 语法
最后更新于
最后更新于
模式定义了数据如何存储、存储什么样的数据以及数据如何分解等信息,数据库和表都有模式。
数据模型(组织层数据模型)描述数据的组织形式。模式是用给定的数据模型对具体数据的描述(就像用某一种编程语言编写具体应用程序一样)。
模式是数据库中全体数据的逻辑结构和特征的描述,它仅仅涉及“型”的描述,不涉及具体的值。
关系模式是关系的“型”或元组的结构共性的描述,它实际上对应的是关系表的表头。模式的一个具体值称为模式的一个实例。一个模式可以有多个实例。模式是相对稳定的(结构不会经常变动),而实例是相对变动的(具体的数据值可以经常变化)。
数据模式描述一类事物的结构、属性、类型和约束,实质上是用数据模型对一类事物进行模拟,而实例是反映某类事物在某一时刻的当前状态。虽然实际的数据库管理系统产品种类很多,支持的数据模型和数据库语言也不尽相同,数据的存储结构也各不相同,但它们在体系结构上通常都具有相同的特征,即采用三级模式结构,并提供两级映像功能。
数据库的三级模式结构是指数据库的外模式、模式和内模式。
SQL(Structured Query Language),标准 SQL 由 ANSI 标准委员会管理,从而称为 ANSI SQL。各个 DBMS(Database Management System) 都有自己的实现,如 PL/SQL、Transact-SQL 等。
SQL 语句不区分大小写,但是数据库表名、列名和值是否区分依赖于具体的 DBMS 以及配置。
主键的值不允许修改,也不允许复用(不能将已经删除的主键值赋给新数据行的主键)。
SQL 支持以下三种注释:
数据库创建与使用:
添加列
删除列
删除表
普通插入
插入检索出来的数据
将一个表的内容插入到一个新表
TRUNCATE TABLE 可以清空表,也就是删除所有行。
使用更新和删除操作时一定要用 WHERE 子句,不然会把整张表的数据都破坏。可以先用 SELECT 语句进行测试,防止错误删除。
相同值只会出现一次。它作用于所有列,也就是说所有列的值都相同才算相同。
限制返回的行数。可以有两个参数,第一个参数为起始行,从 0 开始;第二个参数为返回的总行数。
返回前 5 行:
返回第 3 ~ 5 行:
ASC :升序(默认)
DESC :降序
可以按多个列进行排序,并且为每个列指定不同的排序方式:
不进行过滤的数据非常大,导致通过网络传输了多余的数据,从而浪费了网络带宽。因此尽量使用 SQL 语句来过滤不必要的数据,而不是传输所有的数据到客户端中然后由客户端进行过滤。
下表显示了 WHERE 子句可用的操作符
操作符
说明
=
等于
<
小于
>
大于
<> !=
不等于
<= !>
小于等于
>= !<
大于等于
BETWEEN
在两个值之间
IS NULL
为 NULL 值
应该注意到,NULL 与 0、空字符串都不同。
AND 和 OR 用于连接多个过滤条件。优先处理 AND,当一个过滤表达式涉及到多个 AND 和 OR 时,可以使用 () 来决定优先级,使得优先级关系更清晰。
IN 操作符用于匹配一组值,其后也可以接一个 SELECT 子句,从而匹配子查询得到的一组值。
NOT 操作符用于否定一个条件。
通配符也是用在过滤语句中,但它只能用于文本字段。
% 匹配 >=0 个任意字符;
_ 匹配 ==1 个任意字符;
[ ] 可以匹配集合内的字符,例如 [ab] 将匹配字符 a 或者 b。用脱字符 ^ 可以对其进行否定,也就是不匹配集合内的字符。
使用 Like 来进行通配符匹配。
不要滥用通配符,通配符位于开头处匹配会非常慢。
在数据库服务器上完成数据的转换和格式化的工作往往比客户端上快得多,并且转换和格式化后的数据量更少的话可以减少网络通信量。
计算字段通常需要使用 AS 来取别名,否则输出的时候字段名为计算表达式。
CONCAT() 用于连接两个字段。许多数据库会使用空格把一个值填充为列宽,因此连接的结果会出现一些不必要的空格,使用 TRIM() 可以去除首尾空格。
各个 DBMS 的函数都是不相同的,因此不可移植,以下主要是 MySQL 的函数。
函 数
说 明
AVG()
返回某列的平均值
COUNT()
返回某列的行数
MAX()
返回某列的最大值
MIN()
返回某列的最小值
SUM()
返回某列值之和
AVG() 会忽略 NULL 行。
使用 DISTINCT 可以汇总不同的值。
函数
说明
LEFT()
左边的字符
RIGHT()
右边的字符
LOWER()
转换为小写字符
UPPER()
转换为大写字符
LTRIM()
去除左边的空格
RTRIM()
去除右边的空格
LENGTH()
长度
SOUNDEX()
转换为语音值
其中, SOUNDEX() 可以将一个字符串转换为描述其语音表示的字母数字模式。
日期格式:YYYY-MM-DD
时间格式:HH:MM:SS
函 数
说 明
ADDDATE()
增加一个日期(天、周等)
ADDTIME()
增加一个时间(时、分等)
CURDATE()
返回当前日期
CURTIME()
返回当前时间
DATE()
返回日期时间的日期部分
DATEDIFF()
计算两个日期之差
DATE_ADD()
高度灵活的日期运算函数
DATE_FORMAT()
返回一个格式化的日期或时间串
DAY()
返回一个日期的天数部分
DAYOFWEEK()
对于一个日期,返回对应的星期几
HOUR()
返回一个时间的小时部分
MINUTE()
返回一个时间的分钟部分
MONTH()
返回一个日期的月份部分
NOW()
返回当前日期和时间
SECOND()
返回一个时间的秒部分
TIME()
返回一个日期时间的时间部分
YEAR()
返回一个日期的年份部分
函数
说明
SIN()
正弦
COS()
余弦
TAN()
正切
ABS()
绝对值
SQRT()
平方根
MOD()
余数
EXP()
指数
PI()
圆周率
RAND()
随机数
把具有相同的数据值的行放在同一组中。
可以对同一分组数据使用汇总函数进行处理,例如求分组数据的平均值等。
指定的分组字段除了能按该字段进行分组,也会自动按该字段进行排序。
GROUP BY 自动按分组字段进行排序,ORDER BY 也可以按汇总字段来进行排序。
WHERE 过滤行,HAVING 过滤分组,行过滤应当先于分组过滤。
分组规定:
GROUP BY 子句出现在 WHERE 子句之后,ORDER BY 子句之前;
除了汇总字段外,SELECT 语句中的每一字段都必须在 GROUP BY 子句中给出;
NULL 的行会单独分为一组;
大多数 SQL 实现不支持 GROUP BY 列具有可变长度的数据类型。
子查询中只能返回一个字段的数据。
可以将子查询的结果作为 WHRER 语句的过滤条件:
下面的语句可以检索出客户的订单数量,子查询语句会对第一个查询检索出的每个客户执行一次:
连接用于连接多个表,使用 JOIN 关键字,并且条件语句使用 ON 而不是 WHERE。
连接可以替换子查询,并且比子查询的效率一般会更快。
可以用 AS 给列名、计算字段和表名取别名,给表名取别名是为了简化 SQL 语句以及连接相同表。
内连接又称等值连接,使用 INNER JOIN 关键字。
可以不明确使用 INNER JOIN,而使用普通查询并在 WHERE 中将两个表中要连接的列用等值方法连接起来。
自连接可以看成内连接的一种,只是连接的表是自身而已。
一张员工表,包含员工姓名和员工所属部门,要找出与 Jim 处在同一部门的所有员工姓名。
子查询版本
自连接版本
自然连接是把同名列通过等值测试连接起来的,同名列可以有多个。
内连接和自然连接的区别:内连接提供连接的列,而自然连接自动连接所有同名列。
如果希望不满足连接条件的元组也出现在连接结果中,则可以通过外连接(OUTER JOIN)操作实现。外连接有三种形式:左外连接(LEFT OUTER JOIN)、右外连接(RIGHT OUTER JOIN)和全外连接(FULL OUTER JOIN)。
左外连接的含义是把连接符号左边的关系(这里是关系R)中不满足连接条件的元组也保留到连接后的结果中,并在连接结果中将该元组对应的右边关系(这里是关系S)的各个属性均置成空值(NULL)。
右外连接的含义是把连接符号右边的关系(这里是关系S)中不满足连接条件的元组也保留到连接后的结果中,并在连接结果中将该元组对应的左边关系(这里是R)的各个属性均置成空值(NULL)。
全外连接的含义是把连接符号两边的关系(R和S)中不满足连接条件的元组均保留到连接后的结果中,并在连接结果中将不满足连接条件的各元组的相关属性均置成空值(NULL)。
外连接保留了没有关联的那些行。分为左外连接,右外连接以及全外连接。
左外连接会保留左表没有关联的行,右外连接会保留右表没有关联的行,全外连接会保留左右表没有关联的行。
检索所有顾客的订单信息,包括还没有订单信息的顾客。
customers 表:
cust_id
cust_name
1
a
2
b
3
c
orders 表:
order_id
cust_id
1
1
2
1
3
3
4
3
结果:
cust_id
cust_name
order_id
1
a
1
1
a
2
3
c
3
3
c
4
2
b
Null
使用 UNION 来组合两个查询,如果第一个查询返回 M 行,第二个查询返回 N 行,那么组合查询的结果一般为 M+N 行。
每个查询必须包含相同的列、表达式和聚集函数。
默认会去除相同行,如果需要保留相同行,使用 UNION ALL。
只能包含一个 ORDER BY 子句,并且必须位于语句的最后。
视图是虚拟的表,本身不包含数据,也就不能对其进行索引操作。
对视图的操作和对普通表的操作一样。
视图具有如下好处:
简化复杂的 SQL 操作,比如复杂的连接;
只使用实际表的一部分数据;
通过只给用户访问视图的权限,保证数据的安全性;
更改数据格式和表示。
存储过程可以看成是对一系列 SQL 操作的批处理。
使用存储过程的好处:
代码封装,保证了一定的安全性;
代码复用;
由于是预先编译,因此具有很高的性能。
命令行中创建存储过程需要自定义分隔符,因为命令行是以 ; 为结束符,而存储过程中也包含了分号,因此会错误把这部分分号当成是结束符,造成语法错误。
包含 in、out 和 inout 三种参数。
给变量赋值都需要用 select into 语句。
每次只能给一个变量赋值,不支持集合的操作。
在存储过程中使用游标可以对一个结果集进行移动遍历。
游标主要用于交互式应用,其中用户需要对数据集中的任意行进行浏览和修改。
使用游标的四个步骤:
声明游标,这个过程没有实际检索出数据;
打开游标;
取出数据;
关闭游标;
触发器会在某个表执行以下语句时而自动执行:DELETE、INSERT、UPDATE。
触发器必须指定在语句执行之前还是之后自动执行,之前执行使用 BEFORE 关键字,之后执行使用 AFTER 关键字。BEFORE 用于数据验证和净化,AFTER 用于审计跟踪,将修改记录到另外一张表中。
INSERT 触发器包含一个名为 NEW 的虚拟表。
DELETE 触发器包含一个名为 OLD 的虚拟表,并且是只读的。
UPDATE 触发器包含一个名为 NEW 和一个名为 OLD 的虚拟表,其中 NEW 是可以被修改的,而 OLD 是只读的。
MySQL 不允许在触发器中使用 CALL 语句,也就是不能调用存储过程。
基本术语:
事务(transaction)指一组 SQL 语句;
回退(rollback)指撤销指定 SQL 语句的过程;
提交(commit)指将未存储的 SQL 语句结果写入数据库表;
保留点(savepoint)指事务处理中设置的临时占位符(placeholder),你可以对它发布回退(与回退整个事务处理不同)。
不能回退 SELECT 语句,回退 SELECT 语句也没意义;也不能回退 CREATE 和 DROP 语句。
MySQL 的事务提交默认是隐式提交,每执行一条语句就把这条语句当成一个事务然后进行提交。当出现 START TRANSACTION 语句时,会关闭隐式提交;当 COMMIT 或 ROLLBACK 语句执行后,事务会自动关闭,重新恢复隐式提交。
设置 autocommit 为 0 可以取消自动提交;autocommit 标记是针对每个连接而不是针对服务器的。
如果没有设置保留点,ROLLBACK 会回退到 START TRANSACTION 语句处;如果设置了保留点,并且在 ROLLBACK 中指定该保留点,则会回退到该保留点。
基本术语:
字符集为字母和符号的集合;
编码为某个字符集成员的内部表示;
校对字符指定如何比较,主要用于排序和分组。
除了给表指定字符集和校对外,也可以给列指定:
可以在排序、分组时指定校对:
MySQL 的账户信息保存在 mysql 这个数据库中。
创建账户 CREATE
新创建的账户没有任何权限。
修改账户名 RENAME
删除账户 DROP
查看权限 SHOW
授予权限 GRANT
账户用 username@host 的形式定义,username@% 使用的是默认主机名。
删除权限 REVOKE
GRANT 和 REVOKE 可在几个层次上控制访问权限:
整个服务器,使用 GRANT ALL 和 REVOKE ALL;
整个数据库,使用 ON database.*;
特定的表,使用 ON database.table;
特定的列;
特定的存储过程。
更改密码 SET
必须使用 Password() 函数进行加密。