希望你开心,希望你健康,希望你幸福,希望你点赞!
最后的最后,关注喵,关注喵,关注喵,佬佬会看到更多有趣的博客哦!!!
喵喵喵,你对我真的很重要!
目录
前言
认识字符集和校对原则
MySQL 5.5支持的字符集和校对原则
常用字符集和校对原则
确定字符集和校对原则
描述字符集的系统变量
MySQL用下列的系统变量描述字符集。
字符集的依存关系
修改默认字符集
修改默认字符集
使用MySQL字符集时的建议
预习建立数据库和表
配套练习
总结
前言
MySQL
能够支持
39
种字符集和
127
个校对原则。细化为
4
个层次:
服务器
(Server)
、数据库
(
DataBase
)
、数据表
(Table)
和连接层
(Connection)
。MySQL
服务器
默认的字符集是
latin1
,如果不进行设置,那么连接层级、客户端级和结果返回级、数据库级、表级、字段级都默认使用
latin1
字符集。在向表录入中文数据、查询包括中文字符的数据时,会出现类似“
?
”这样的
乱码
现象。在创建存储过程或存储函数时,也经常由于字符集的不统一出现错误。本任务从认识字符集和校对原则着手,学习
MySQL
支持的字符集和校对原则。着重介绍
latin1
、
UTF-8
和
gb2312
字符集。通过认识描述字符集的系统变量,学习掌握修改默认字符集的方法。介绍在实际应用中,如何选择合适的字符集。
认识字符集和校对原则
字符
(Character)
是指人类语言中最小的表义符号。例如
‘A’
、
‘B’
等。给定一系列字符,并给每个字符指定一个数值来进行表示,这个数值就是
对应字符的编码(
Encoding
)
。给定一系列字符,并给每个字符进行编码后,所有字符和编码对组成的集合就是字符集(
Character set
)。比如:
ASSII
码。字符校对原则
(Collation)
是指在
同一字符集内字符之间的
比较规则。确定字符序后,才能在一个字符集上定义什么是等价的字符(
a
是否等价
A
),以及字符之间的大小关系。每个字符序唯一对应一种字符集,但
一个字符集可以对应多种字符校对原则
,其中有一个是默认字符校对原则
(Default Collation)
。MySQL
中的字符序名称遵从命名惯例:以字符序对应的字符集名称开头;以
_ci(
表示大小写不敏感
)
、
_cs(
表示大小写敏感
)
或
_bin(
表示按编码值比较
)
结尾。例如,在字符序“
utf8_general_ci
“下,字符
‘a’
和
‘A’
是等价的。
MySQL 5.5支持的字符集和校对原则
MySQL 5.5
服务器能够支持
39
种字符集和
127
个校对原则。任何一个给定的字符集至少有一个校对原则,也可能有几个校对原则。可以使用
SHOW
命令列出可用的字符集及对应校对原则。如:mysql >SHOW CHARACTER SET;
mysql> SHOW COLLATION LIKE ‘latin1%’;
常用字符集和校对原则
Latin1系统启动时默认的字符集,是一个8位字符集,字符集名称为ISO 8859-1Latin 1,也简称为ISO Latin-1。
它把位于128~255之间的字符用于拉丁字母表中特殊语言字符的编码,也因此而得名。
UTF-8
(
8-bit Unicode Transformation Format
)被称为通用转换格式,是针对Unicode字符的一种变长字符编码,又称万国码。
对英文使用8位(即1个字节),中文使用24位(3个字节)来编码。
UTF-8包含全世界所有国家需要用到的字符,是国际编码,通用性强。
UTF-8编码的文字可以在各国支持UTF-8字符集的浏览器上显示。
gb
2312是简体中文字符集,GBK是对GB 2312的扩展,其校对原则是分别为gb2312_chinese_ci、gbk_chinese_ci。
GBK的文字编码不论中、英文字符均使用双字节表示。GBK通用性比UTF-8差,占用的数据库较小。
GBK、GB 2312与UTF-8之间都必须通过Unicode编码才能相互转换。
对于一个网站、论坛来说,如果英文字符较多,则建议使用UTF-8节省空间。不过现在很多论坛的插件一般只支持GBK。
确定字符集和校对原则
描述字符集的系统变量
MySQL
对于字符集的支持细化到
4
个层次
:
服务器
(Server)
、数据库
(
DataBase
)
、数据表
(Table)
和连接
(Connection)
。MySQL
对于字符集的指定
可以细化
到一个数据库、一张表和一列。
MySQL用下列的系统变量描述字符集。
character_set_
server
和
collation_
server
:这两个变量是
服务器
的字符集,默认的
内部
操作字符集。character_set_
client
:客户端来源数据使用的字符集,这个变量用来决定
MySQL
怎么
解释
客户端发到服务器的
SQL
命令文字。character_set_connection和collation_connection :连接层字符集。这两个变量用来决定MySQL怎么处理客户端发来的SQL命令。
character_set_results:查询结果字符集,当SQL有结果返回的时候,这个变量用来决定发给客户端的结果中文字量的编码。
character_set_database和collation_database :当前选中数据库的默认字符集,create database命令有两个参数可以用来设置数据库的字符集和比较规则。character_set_system:系统元数据的字符集,数据库、表和列的定义都是用的这个字符集。它有一个定值,是UTF-8 。
以“collation_”开头的同上面对应的变量,用来描述字符集校对原则。
有的字符集概念并没有一个系统变量表示,如:
表所使用的字符集,在创建表的语句中指定,作为该表中列字体集的默认值。
列所使用的字符集,决定本列的文字数据的存储编码。列的比较规则比collation_connection高。也就是说,MySQL会把SQL中的文字直接量转成列的字符集后再与列的文字数据比较。
字符集的依存关系
MySQL
默认的服务器级的字符集,决定客户端、连接级和结果级的字符集。服务器级的字符集决定数据库的字符集。数据库的字符集决定表的字符集。表的字符集决定字段的字符集。
MySQL默认字符集
编译
MySQL
时,指定了一个默认的字符集,这个字符集是“
latin1
”。安装
MySQL
时,可以在
配置文件
(
my.ini
)中重新指定默认字符集。启动
MySQL
时,也可在命令行参数中重新指定默认字符集。默认字符集最终被
应用于
character_set_server
,再被应用于其下级字符集。
修改默认字符集
修改
MySQL
的
my.ini
(
C:Program Files MySQLMySQL Server 5.5
)文件中的字符集
查找[mysql]键值,在下面加上一行: default-character-set=utf8
修改保存后,可用语句查看。
mysql> SHOW VARIABLES LIKE ‘character%
修改默认字符集
使用
MySQL
的命令修改字符集。
mysql> SET character_set_client = utf8 ;
mysql> SET character_set_connection = utf8;
mysql> SET character_set_database = utf8 ;
mysql> SET character_set_results = utf8 ;
mysql> SET character_set_server = utf8 ;
使用MySQL字符集时的建议
建立数据库、表和进行数据库操作时,尽量
显式指出
使用的字符集,而不是依赖于默认设置。数据库和连接字符集都使用
latin1
时,大部分情况下都可以解决乱码问题,但无法以字符为单位来进行
SQL
操作,因此
使用
UTF-8
更好
。注意服务器级、结果级、客户端级、连接级、数据库级、表级的字符集的统一,当数据库级的字符集设置为
UTF-8
时,表级与字段级的字符集也是
UTF-8
。
预习建立数据库和表
建立数据库和表是指在计算机系统中创建一个存储数据的地方,并在其中创建表格来组织和管理数据。数据库是一个可以被多个用户同时访问和操作的数据存储系统,而表则是数据库中的一个结构化数据容器。下面将介绍如何建立数据库和表。
首先,选择一个适合的数据库管理系统(DBMS),如MySQL、Oracle或SQL Server等。这些DBMS提供了丰富的功能和工具来管理和操作数据库。
接下来,通过运行DBMS提供的命令或工具来创建数据库。一般情况下,可以使用CREATE DATABASE语句来创建数据库,并指定数据库的名称。例如,CREATE DATABASE mydatabase;创建一个名为mydatabase的数据库。
创建数据库之后,就可以在其中创建表格了。表格用于存储数据,并且有一定的结构和规则。使用CREATE TABLE语句可以创建一个新的表格。在CREATE TABLE语句中,需要指定表格的名称和列的信息。每个列都有一个名称和数据类型。例如,CREATE TABLE customers (id INT, name VARCHAR(50), email VARCHAR(100));将创建一个名为customers的表格,并包含id、name和email三列,分别是整数和两个字符串。
在创建表格之后,可以使用INSERT语句来向表格中插入数据。INSERT语句可以插入一条或多条数据。例如,INSERT INTO customers (id, name, email) VALUES (1, ‘John’, ‘john@example.com’);将向customers表格中插入一条数据。
创建数据库和表格后,就可以使用SELECT语句来查询数据,使用UPDATE语句来更新数据,使用DELETE语句来删除数据等。这些语句可以通过DBMS提供的命令行界面或图形化界面来执行。
总之,建立数据库和表是管理和组织数据的重要步骤。通过选择合适的DBMS,并使用相应的命令和工具,可以轻松地创建数据库和表格,并对其中的数据进行管理和操作。
配套练习
一、mysql注释:
mysql注释符有三种:1、#…2、— …3、/*…*/
二、启动mysql服务器(startup)à打开命令窗口clientà输入:
2.1 mysql >SHOW CHARACTER SET;//显示所有字符集
mysql> SHOW COLLATION LIKE ‘latin1%’;//显示以latin1开头的校对(Collation)规则:
2.2. 修改MySQL的配置文件my.ini(自己安装的mysql路径)文件中的字符集
查找[mysql]键值,在下面加上一行: default-character-set=utf8
修改保存后,可用语句查看。
mysql> SHOW VARIABLES LIKE ‘character%’;
重新启动服务器后再次查看字符集(先shutdown再startup)
2.3使用MySQL的命令修改字符集,修改后可用show variables like ‘character%’;查看。
mysql> SET character_set_client = utf8 ;
mysql> SET character_set_connection = utf8;
mysql> SET character_set_database = utf8 ;
mysql> SET character_set_results = utf8 ;
mysql> SET character_set_server = utf8 ;
三、解决发送前的乱码
MySQL> SET NAMES ‘UTF8 ’;
与这3个语句等价:
mysql> SET character_set_client =UTF8;
mysql> SET character_set_results = UTF8;
mysql> SET character_set_connection =UTF8;
四、修改MySQL的my.ini文件中,将默认字符集修改为gb2312。
提前预热
以下是MySQL的简单代码示例:
先看看,喵~
连接到MySQL数据库
import mysql.connector
mydb = mysql.connector.connect(
host="localhost",
user="yourusername",
password="yourpassword"
)
print(mydb)
创建数据库
import mysql.connector
mydb = mysql.connector.connect(
host="localhost",
user="yourusername",
password="yourpassword"
)
mycursor = mydb.cursor()
mycursor.execute("CREATE DATABASE mydatabase")
创建表
import mysql.connector
mydb = mysql.connector.connect(
host="localhost",
user="yourusername",
password="yourpassword",
database="mydatabase"
)
mycursor = mydb.cursor()
mycursor.execute("CREATE TABLE customers (name VARCHAR(255), address VARCHAR(255))")
插入数据
import mysql.connector
mydb = mysql.connector.connect(
host="localhost",
user="yourusername",
password="yourpassword",
database="mydatabase"
)
mycursor = mydb.cursor()
sql = "INSERT INTO customers (name, address) VALUES (%s, %s)"
val = ("John", "Highway 21")
mycursor.execute(sql, val)
mydb.commit()
print(mycursor.rowcount, "record inserted.")
总结
MySQL
能够支持
39
种字符集和
127
个校对原则。细化为
4
个层次:
服务器
(Server)
、数据库
(
DataBase
)
、数据表
(Table)
和连接层
(Connection)
。MySQL
服务器
默认的字符集是
latin1
,如果不进行设置,那么连接层级、客户端级和结果返回级、数据库级、表级、字段级都默认使用
latin1
字符集。在向表录入中文数据、查询包括中文字符的数据时,会出现类似“
?
”这样的
乱码
现象。在创建存储过程或存储函数时,也经常由于字符集的不统一出现错误。本任务从认识字符集和校对原则着手,学习
MySQL
支持的字符集和校对原则。着重介绍
latin1
、
UTF-8
和
gb2312
字符集。通过认识描述字符集的系统变量,学习掌握修改默认字符集的方法。介绍在实际应用中,如何选择合适的字符集。
希望你开心,希望你健康,希望你幸福,希望你点赞!
最后的最后,关注喵,关注喵,关注喵,佬佬会看到更多有趣的博客哦!!!
喵喵喵,你对我真的很重要!