前言
GaussDB是华为自主创新研发的分布式关系型数据库,为企业提供功能全面、稳定可靠、扩展性强、性能优越的企业级数据库服务。在实际业务场景使用中,为了提高工作效率,数据库GaussDB提供定时任务的功能,本节为大家讲解GaussDB如何创建和管理,序列及定时任务。
一、创建和管理序列 序列Sequence是用来产生唯一整数的数据库对象。序列的值是按照一定规则自增的整数。因为自增所以不重复,因此说Sequence具有唯一标识性。这也是Sequence常被用作主键的原因。
通过序列使某字段成为唯一标识符的方法有两种:
1)一种是声明字段的类型为序列整理,由数据库在后台自动创建一个对应的Sequence。
2)另一种是使用CREATE SEQUENCE自定义一个新的Sequence,然后将nextval(‘sequence_name’)函数读取的序列值,指定为某一字段的默认值,这样该字段就可以作为唯一标识符。
1、操作步骤 方法一: 声明字段类型为序列整型来定义标识符字段。例如: postgres=# CREATE TABLE T1 ( id serial, name text ); 当结果显示为如下信息,则表示创建成功。
CREATE TABLE 方法二: 创建序列,并通过nextval(‘sequence_name’)函数指定为某一字段的默认值。这种方式更灵活,可以为序列定义cache,一次预申请多个序列值,减少与GTM的交互次数,来提高性能。
1、创建序列
postgres=# CREATE SEQUENCE seq1 cache 100; 当结果显示为如下信息,则表示创建成功。
CREATE SEQUENCE 2、指定为某一字段的默认值,使该字段具有唯一标识属性。
postgres=# CREATE TABLE T2 ( id int not null default nextval(‘seq1’), name text ); 当结果显示为如下信息,则表示默认值指定成功。
CREATE TABLE 3、指定序列与列的归属关系。
将序列和一个表的指定字段进行关联。这样,在删除那个字段或其所在表的时候会自动删除已关联的序列。
postgres=# ALTER SEQUENCE seq1 OWNED BY T2.id; 当结果显示为如下信息,则表示指定成功。
ALTER SEQUENCE 注意事项 新序列值的产生是靠GTM维护的,默认情况下,每申请一个序列值都要向GTM发送一次申请,GTM在当前值的基础上加上步长值作为产生的新值返回给调用者。GTM作为全局唯一的节点,势必成为性能的瓶颈,所以对于需要大量频繁产生序列号的操作,如使用Bulkload工具进行数据导入场景,是非常不推荐产生默认序列值的。比如,在下面所示的场景中, INSERT FROM SELECT语句的性能会非常慢。
postgres=# CREATE SEQUENCE newSeq1; postgres=# CREATE TABLE newT1 ( id int not null default nextval(‘newSeq1’), name text ); postgres=# INSERT INTO newT1(name) SELECT name from T1; 可以提高性能的写法是(假设T1表导入newT1表中的数据为10000行):
postgres=# INSERT INTO newT1(id, name) SELECT id,name from T1; postgres=# SELECT SETVAL(‘newSeq1’,10000); 如果必须要在bulkload场景下产生默认序列值,则一定要为newSeq1定义足够大的cache,并且不要定义Maxvalue或者Minvalue。数据库会试图将nextval(‘sequence_name’)的调用下推到Data Node,以提高性能。 目前GTM对并发的连接请求是有限制的,当Data Node很多时,将产生大量并发连接, 这时一定要控制bulkload的并发数目,避免耗尽GTM的连接资源。如果目标表为复制表(DISTRIBUTE BY REPLICATION)时下推将不能进行。当数据量较大时,这对数据库将是个灾难。除了性能问题之外,空间也可能会剧烈膨胀,在导入结束后,需要用vacuum full来恢复。推荐采用如上建议,不要在bulkload的场景中产生默认序列值。
另外,序列创建后,在每个节点上都维护了一张单行表,存储序列的定义及当前值,但此当前值并非GTM上的当前值,只是保存本节点与GTM交互后的状态。如果其他节点也向GTM申请了新值,或者调用了Setval修改了序列的状态,不会刷新本节点的单行表,但因每次申请序列值是向GTM申请,所以对序列正确性没有影响。
二、定时任务管理 当用户在使用数据库过程中,如果白天执行一些耗时比较长的任务(例如:统计数据汇总之类或从其他数据库同步数据的任务),会对正常的业务有性能影响,所以用户经常选择在晚上执行,这增加了用户的工作量。因此数据库GaussDB提供定时任务的功能,可以由用户创建定时任务,当任务时间点到达后可以自动触发任务的执行,从而可以减少用户户运维的工作量。
GaussDB提供定时任务的创建、任务到期自动执行、任务删除、修改任务属性(包括:任务id、任务的关闭开启、任务的触发时间、触发时间间隔、任务内容等)。
步骤 1 创建测试表: postgres=# CREATE TABLE test(id int, time date); 当结果显示为如下信息,则表示创建成功。
CREATE TABLE 步骤 2 创建自定义存储过程: postgres=# CREATE OR REPLACE PROCEDURE PRC_JOB_1() AS N_NUM integer :=1; BEGIN FOR I IN 1..1000 LOOP INSERT INTO test VALUES(I,SYSDATE); END LOOP; END; / 当结果显示为如下信息,则表示创建成功。
CREATE PROCEDURE 步骤 3 创建任务: 新创建的任务(未指定job_id)表示每隔1分钟执行一次存储过程PRC_JOB_1。 postgres=# call dbe_task.submit(‘call public.prc_job_1(); ‘, sysdate, ‘interval ”1 minute”’, :a); job
1 (1 row) 指定job_id创建任务,其中job_id可用范围为1~32767。 postgres=# call dbe_task.id_submit(2,’call public.prc_job_1(); ‘, sysdate, ‘interval ”1 minute”’); isubmit
(1 row) 步骤 4 通过视图查看当前用户已创建的任务信息。 postgres=# select job,dbname,start_date,last_date,this_date,next_date,broken,status,interval,failures,what from my_jobs; job | dbname | start_date | last_date | this_date | next_date | broken | status | interval | failures | what —–+——–+———————+—————————-+—————————-+———————+——–+——–+———————+———-+————————— 1 | postgres | 2017-07-18 11:38:03 | 2017-07-18 13:53:03.607838 | 2017-07-18 13:53:03.607838 | 2017-07-18 13:54:03 | n | s | interval ‘1 minute’ | 0 | call public.prc_job_1(); (1 row) 步骤 5 停止任务。 postgres=# call dbe_task.finish(1,true); broken
(1 row) 步骤 6 启动任务。 postgres=# call dbe_task.finish(1,false); broken
(1 row) 步骤 7 修改任务属性: 修改JOB的Next_date参数信息。 –修改Job1的Next_date为1小时以后开始执行。
postgres=# call dbe_task.next_time(1, sysdate+1.0/24); next_date
(1 row) 修改JOB的Interval参数信息。 –修改Job1的Interval为每隔1小时执行一次。
postgres=# call dbe_task.interval(1,’sysdate + 1.0/24′); interval
(1 row) 修改JOB的What参数信息。 –修改Job1的What为执行SQL语句“insert into public.test values(333, sysdate+5);”。
postgres=# call dbe_task.content(1,’insert into public.test values(333, sysdate+5);’); what
(1 row) 同时修改JOB的Next_date、Interval、What等多个参数信息。 postgres=# call dbe_task.update(1, ‘call public.prc_job_1();’, sysdate, ‘interval ”1 minute”’); change
(1 row) 步骤 8 删除JOB。 postgres=# call dbe_task.cancel(1); remove
(1 row) 三、总结
GaussDB数据库提供了便捷的定时任务功能,以满足不同的需求。在使用这个功能的同时,需要注意,定时任务的设置和使用需要谨慎,避免误删重要数据或影响业务正常运行。同时,也需要保证定时任务的可靠性和稳定性,避免出现任务漏执行或执行重复的情况。
在使用GaussDB数据库时,创建定时任务可以在很多场景中应用,同时可以帮助我们提高系统的运行效率,大大的增加了数据库的便利性。