玩oracle 2年多了,从接触oracle 到现在,一直没有停止过学习。 要学的东西太多,刚入门的时候是这样的感觉,现在还是这样的感觉。 有时候也在想,还要学多长时间才能感觉自我良好了,有十足的自信心了。 很多朋友都想做dba, 因为他们觉得这一个高薪的行业。 但是并不是所有都明白为什么dba是个高薪的行业。 高薪意味着压力大,责任大。
现代化的程度越高,对数据库的依赖性越大。 数据安全性和系统的安全性也就越大。比如公司业务系统。 数据库是直接的存储地方的,他的重要性是不言而喻的,宕机带来的损失可能是按分钟或者秒算的。 而谁对这些数据库负责--dba。 所以很多公司,企业都是找有经验的dba ,他们也是在为他们的系统买保险。 这也是为什么企业不愿意招一个没有实战经验的dba来管理自己的数据库。
试想某个省移动的数据库出了问题,造成数据丢失,在比如银行数据库挂了。 他们带来的损失不光是影响正常的业务运行,还有可能是数据错误。假如你在银行存了100万,结果银行一不小心,在数据库里少了几个0. 这个是谁也不愿意看到的。 当然以上都是假设的情况。 因为像这些数据重要性极高的单位,他们都有一整套数据的保护机制。 是不会发生这种情况的。
下面就来总结一下如何的来搭建一个数据库平台。 主要从参数和一些特性的配置上来说明。当然我玩oracle也才2年,经验不足,可能对与这些参数的设置也不是很合理。
从网上看到过一句话:每个dba心中对重要的参数都有一个标准。 我想这也是经验的价值。
一. linux 系统
说明,在安装操作系统之前,现在服务器上做个raid。一般都用raid5.
1.linux磁盘划分:
a.对于内置2块磁盘(146gb)的系统,/目录20gb,swap与内存大小相当(8gb以下内存机器swap配置8gb),/boot 100mb。如果作为应用服务器,那么其余空间建立/apps文件系统,mke2fs –j 命令;如果作为数据库平台,那么建立/dba文件系统20gb,其余建立/u01文件系统。
b.对于内置4-6块磁盘的系统,/目录60gb,swap与内存大小相当(8gb以下内存机器swap配置8gb),/boot 100mb。如果作为应用服务器,那么其余空间建立/apps文件系统,mke2fs –j 命令;如果作为数据库平台,那么建立/dba文件系统40gb,其余建立/u01文件系统。
c.对于oracle数据文件目录文件系统使用mke2fs –j –t largefiles命令建立
2.对于非外接存储情况下:
a.oracle目录标准:oracle_home=/dba/app/oracle/product/10.2.0.4(按版本指定)
oracle_base=/dba (dump目录为/dba/admin/sid/)
datafile目录为/u01/oradata/sid
归档空间目录/u01/oradata/archive_sid
b.对于有外接存储(/u02…)情况下:
oracle目录标准:oracle_home=/dba/app/oracle/product/10.2.0.4(按版本指定)
oracle_base=/u01 (dump目录为/u01/admin/sid/)
datafile目录为/u02/oradata/sid
归档空间目录/u01/oradata/archive_sid
c.oracle建库采用customer方式,直接更改初始undo和temp空间8gb(或者4gb,或者通过增加文件数目到更大,根据业务系统),system空间512mb(或者1gb)。redolog为100mb,单个数据文件大小以8gb为宜(因ext3文件系统特性使然),建议数据文件一次性划分到8g, 以保证数据文件的连续性。
3.参数及服务配置:
方法一:建立ntp时间同步服务,/etc/ntp.conf中加入server 10.0.30.172,执行# ntpdate 10.0.30.172,# service ntpd start ,# chkconfig --level 235 ntpd on
方法二: 时间同步配置(编辑crontab)
输入命令:ntpdate 10.0.30.172
crontab –e(编辑crontab)
按i进入输入状态,输入以下一行:
01 01 * * * root /usr/sbin/ntpdate 10.0.30.172 >/dev/null 2>&1(每天01:01与时间服务器10.0.30.172同步时间)
:wq!(保存退出)
更多信息参考我的blog: linux 时间同步配置
http://blog.csdn.net/tianlesoftware/archive/2010/02/22/5315587.aspx
4. linux 内核参数修改
4.1 修改内核参数/etc/sysctl.conf,对于8gb-16gb内存机器
kernel.shmall = 2097152 à 4194304 ( 4kb单位,总内存大小)
kernel.shmmax = à8589934592(实际物理内存的2/3)
kernel.shmmni = 4096
对于16gb内存以上机器
kernel.shmall = 2097152 à 8388608 ( 4kb单位,总内存大小)
kernel.shmmax = à10179869184(比实际物理内存的2/3)
kernel.shmmni = 4096 –>8192
net.ipv4.ip_local_port_range = 9000 65500
net.core.rmem_default = 262144
net.core.rmem_max = 4194304
net.core.wmem_default = 262144
net.core.wmem_max = 1048586
以前也整理的相关的资料,详见blog: linux 内核参数及oracle相关参数调整
http://blog.csdn.net/tianlesoftware/archive/2009/10/15/4668741.aspx
4.2.根据应用情况修改进程数限制 /etc/security/limits.conf
* soft nproc 2047
* hard nproc 16384
* soft nofile 1024 ->2048
* hard nofile 65536
注:关于内核参数的修改,在oracle 官方的安装文档里也有相关说明:
http://download.oracle.com/docs/cd/b28359_01/install.111/b32002/pre_install.htm#babfdghj
在连接中的第 2.7 configure oracle installation owner shell limits 节。也有详细介绍。
二. oracle 配置
安装实例之前,记得修改db_files , maxdatafiles 和maxloghistory 参数。 这2个参数是放在控制文件里的,如果在安装实例的时候没有设置成合适的值,以后调整起来会很麻烦。
具体参考:
oracle db_files 和 maxdatafiles 说明
http://blog.csdn.net/tianlesoftware/archive/2011/06/07/6530421.aspx
1. 创建pfile 参数
oracle 默认只会创建spfile,但这是个二进制文件,无法进行修改。 为了保险期间。我们要在开始就创建一个pfile 文件,语句很简单,但作用不可忽略。
sql>create pfile from spfile;
windows 下生成的pfile 文件默认在$oracle_home/database 下
linux 默认位置在$oracle_home/dbs 下
2. sga, pga 设置
先来看几个sql
sql> show parameter sga
name type value
------------------------------------ ----------- -------
lock_sga boolean false
pre_page_sga boolean false
sga_max_size big integer 584m
sga_target big integer 584m
sql> show parameter pga
name type value
------------------------------------ ----------- ------
pga_aggregate_target big integer 194m
sql> select name,value ,issys_modifiable from v$parameter where name like 'sga%';
name value issys_mod
--------------- --------------- ---------
sga_max_size 612368384 false
sga_target 612368384 immediate
sql> select name,value,issys_modifiable from v$parameter where name like 'pga%';
name value issys_mod
-------------------- ---------- ---------
pga_aggregate_target 203423744 immediate
如果issys_modifiable 返回的是false,说明该参数无法用alter system语句动态修改,需要重启数据库。
所以sga_max_size 是不可以动态调整的。
在安装之后我们要对pga 和 sga 进行设置。 因为sga_max_size 是非动态的,修改后需要重启,所以我们在开始设置的时候可以把sga_max_size设大一点。 sga_target 是动态的,我们可以根绝需要进行调整。这个调整主要根据命中率来。这里就不多说。当指定sga_target小于sga_max_size,实例重启后,sga_max_size就自动变为和sga_target一样的值了。
对于oltp系统,一般的建议是将sga_max_size 设为物理内存的60%,pga 设为20%。
下表是一个参考值:
系统内存
sga_max_size值
1g
400-500m
2g
1g
4g
2500m
8g
5g
这个参数修改可以在pfile里修改,也可以通过命令直接来:
sql> alter system set pga_aggregate_target=150m scope=spfile;
系统已更改。
sql> alter system set sga_target=500m scope=spfile;
系统已更改。
sql> alter system set sga_max_size=510m scope=spfile; --要是参数生效,需要重启
系统已更改。
sql> alter system set sga_max_size=510m scope=both;
alter system set sga_max_size=510m scope=both
*
第 1 行出现错误:
ora-02095: 无法修改指定的初始化参数
sql> alter system set sga_target=550m scope=both;
系统已更改。
sql> show parameter sga
name type value
------------------------------------ ----------- --------
lock_sga boolean false
pre_page_sga boolean false
sga_max_size big integer 584m
sga_target big integer 550m
以上都是针对oracle 10g 版本的。 如果是9i的话,还需要对每个参数进行配置,如share pool,db buffer,java pool,redo log buffer等。
oracle 内存详细分析请参考csdn blog:oracle 内存 架构 详解
http://blog.csdn.net/tianlesoftware/archive/2010/05/16/5594080.aspx
3. undo, temp 表空间设置
3.1 undo
undo 表空间放的是数据的前镜像,当做某个记录多修改时,原记录就会放到undo 中。所以undo 表空间的大小影响数据的恢复能力。 对它的配置要用点心思。
sql> show parameter undo
name type value
------------------------------------ ----------- -----------
undo_management string auto
undo_retention integer 900
undo_tablespace string undotbs1
undo_retention 只是指定undo 数据的过期时间,默认是900s,15分钟。建议改成10800s,即3个小时。
sql> alter system set undo_retention=10800 scope=both;
系统已更改。
至于undo 表空间的大小,如果磁盘空间允许,就将表空间设为32g,分成4个数据文件,单个数据文件8g。 如果空间有限,就设为8g或者16g(8*2)。
不过现在的服务器硬盘都是比较大,如果放在存储上,那空间更大,所以32g。相对而言就就是一个很小的空间了。
alterdatabasedatafile'd:/oracle/product/10.2.0/oradata/orcl/undotbs01.dbf' resize50m;
altertablespace undotbs1 adddatafile'd:/oracle/product/10.2.0/oradata/orcl/undotbs02.dbf'size5mautoextendonnext5mmaxsizeunlimited;
大量的dml 操作会产生大量的undo,尤其是update,delete。 当undo 特别大的时候,我们可以把undo 删了重建。
具体参考我的blog:oracle undo 回滚段管理
http://blog.csdn.net/tianlesoftware/archive/2009/11/30/4901666.aspx
3.2 temp
临时表空间主要用途是在数据库进行排序运算、管理索引、访问视图等操作时提供临时的运算空间,当运算完成之后系统会自动清理。当oracle里需要用到sort的时候,pga中sort_area_size大小不够时,将会把数据放入临时表空间里进行排序,同时如果有异常情况的话,也会被放入临时表空间,正常来说,在完成select语句、create index等一些使用temp表空间的排序操作后,oracle是会自动释放掉临时段的。但有些有侯我们则会遇到临时段没有被释放,temp表空间几乎满的状况,甚至是我们重启了数据库仍没有解决问题。
alterdatabasetempfile'd:/oracle/product/10.2.0/oradata/orcl/temp01.dbf' resize30m;
altertablespace temp addtempfile'd:/oracle/product/10.2.0/oradata/orcl/temp02.dbf'size10mautoextendonnext1mmaxsizeunlimited;
和undo 一样,可以设为32g (4*8g)或者16g(2*8g),具体情况具体对待。如果遇到temp tablespace 满了的话,我们也可以重建其表空间。 具体操作方法,参考blog:oracle temp 临时表空间
http://blog.csdn.net/tianlesoftware/archive/2009/10/20/4697417.aspx
4. 修改sessions 和 processes 参数
数据库默认的sessions 是170,processes 是150. 这2个数值肯定是不能满足系统需要的。我们需要把这2个参数调大一点。 方法还是一样,可以直接修改pfile,也可以用sql.建议把processes改成1000.sessions 改成2000. 当然具体情况具体对待。
sql> select name,value,issys_modifiable from v$parameter where name='sessions';
name value issys_mod
-------------------- ---------- ---------
sessions 170 false
sql> select name,value,issys_modifiable from v$parameter where name='processes';
name value issys_mod
-------------------- ---------- ---------
processes 150 false
从上面的结果我们可以知道,修改这2个参数必须重启数据库。
sql> alter system set sessions=2000 scope=spfile;
系统已更改。
sql> alter system set processes=1000 scope=spfile;
系统已更改。
oracle sessions,processes 和 transactions 参数 关系 说明
http://blog.csdn.net/tianlesoftware/article/details/6893561
5. 修改session_cached_cursors 和 open_cursors 参数
设置open_cursors=1000
设置session_cached_cursors= 100. 这个参数是静态参数,修改需要重启数据库。
sql> alter system set open_cursors=1000scope=both sid='*';
system altered.
sql> alter system setsession_cached_cursors=100 scope=spfile sid='*';
system altered.
5. 启动归档模式,并部署定期删除归档文件脚本.
生产库必定运行在归档模式下,因为通过归档,我们对数据进行恢复。我们rman 备份,data guard也需要归档文件。
数据库归档非归档的切换比较简单。
sql> alter system set log_archive_dest_1='location=/u01/newccs_archive';
sql> shutdown immediate
sql> startup mount;
sql> alter database archivelog;
sql> alter database open;
sql> archive log list;
database log mode archive mode
automatic archival enabled
archive destination /u01/newccs_archive
oldest online log sequence 27622
next log sequence to archive 0
current log sequence 27624
oracle 归档与非归档的切换
http://blog.csdn.net/tianlesoftware/archive/2009/10/19/4693470.aspx
要强调的一点,在切换为归档之前一定要指定归档目录,即log_archive_dest_1。这个目录用来指定归档文件存放的位置,如果不指定,就会放到闪回区。 闪回区默认只有2g,一但满了之后就会出现问题,如导致数据库hang或者不能启动。 这个也是初学者容易犯的问题。 要是遇到这种问题,处理方法参考我的blog:
ora-16014: log string sequence# string not archived, no available destinations flash recovery area 空间不足
http://blog.csdn.net/tianlesoftware/archive/2010/04/29/5537550.aspx
删除归档日志的脚本,请参考blog:
http://blog.csdn.net/tianlesoftware/archive/2010/01/20/5211659.aspx
6. 开启flashback
flashback 技术是以undo segment中的内容为基础的, 因此受限于undo_retenton参数。要使用flashback 的特性,必须启用自动撤销管理表空间。
在oracle 10g中, flash back家族分为以下成员: flashback database, flashback drop,flashback query(分flashback query,flashback version query, flashback transaction query 三种) 和flashback table。
flashback 是不完全恢复的一种补充,它很灵活。但是flashback database默认是关闭的,所以我们要启动它。
要注意的是:启动它必须在mount 状态
sql> startup mount
sql> select name, current_scn, flashback_on from v$database;
name current_scn flashback_on
--------- ----------- ------------------
orcl 0 no
sql> alter database flashback on;
数据库已更改。
sql> select name, current_scn, flashback_on from v$database;
name current_scn flashback_on
--------- ----------- ------------------
orcl 0 yes
oracle flashback 技术 总结
http://blog.csdn.net/tianlesoftware/archive/2009/10/16/4677378.aspx
7. 检查redo
redo 里记录的是数据库的操作。 在相关事务操作的时候,都会是先写redo,等redo 写完会再去修改相应的数据。 这也oracle的一种机制。如果出现问题,也可以通过这些记录进行恢复。
redo 默认有3个组,每个组有一个文件,每个文件50m。
将redo log 的文件大小改成100m一个。 每组创建2个成员。 最好将每组的2个成员放在不同的磁盘上。 因为写redo 的时候是并行的,放在一起,可能会出现等待事件:log file parallel write。
关于等待事件,参考:
oracle 常见的33个等待事件
http://blog.csdn.net/tianlesoftware/archive/2010/08/12/5807800.aspx
与控制文件一样,如果每组具有多个成员(事实也应当如此),那么仍然不必担心保持这些成员同步的问题。lgwr能够确保对所有成员进行并行写操作,从而使这些成员完全相同。如果丢失某个组的一个成员,只要还存在其他成员,数据库仍然能够继续运行。
redo 空间的不足还会导致一种警告: checkpoint not complete. 具体参考blog:
redo log 和checkpoint not complete
http://blog.csdn.net/tianlesoftware/archive/2009/12/01/4908066.aspx
redolog checkpoint 和 scn关系
http://blog.csdn.net/tianlesoftware/archive/2010/01/25/5251916.aspx
显示当前归档日志组和成员:
sql> select group#,member from v$logfile;
group# member
---------- ---------------------------------------------------
3 d:/oracle/product/10.2.0/oradata/orcl/redo03.log
2 d:/oracle/product/10.2.0/oradata/orcl/redo02.log
1 d:/oracle/product/10.2.0/oradata/orcl/redo01.log
添加redo log组:
sql> alter database add logfile group 4 ('d:/oracle/product/10.2.0/oradata/orcl/redo04.log') size 10m;
sql> select group#,member from v$logfile;
group# member
---------- ----------------------------------------------------
3 d:/oracle/product/10.2.0/oradata/orcl/redo03.log
2 d:/oracle/product/10.2.0/oradata/orcl/redo02.log
1 d:/oracle/product/10.2.0/oradata/orcl/redo01.log
4 d:/oracle/product/10.2.0/oradata/orcl/redo04.log
检查新加入的log状态
sql> select group#,sequence#,bytes,members,status from v$log;
group# sequence# bytes members status
---------- ---------- ---------- ---------- ----------------
1 17 52428800 1 current
4 0 10485760 1 unused
3 16 52428800 1 inactive
2 15 52428800 1 inactive
(虽然这里是unused的状态,但是通过切换日志文件或者数据库自动切换,该文件会被改为active状态)
添加新的文件到group 1
sql> alter database add logfile member 'd:/oracle/product/10.2.0/oradata/orcl/redo05.log' to group 1;
sql> select group#,sequence#,bytes,members,status from v$log;
group# sequence# bytes members status
---------- ---------- ---------- ---------- ----------------
1 17 52428800 2 current
4 0 10485760 1 unused
3 16 52428800 1 inactive
2 15 52428800 1 inactive
这里的group组中的member就变为2;
sql> select member from v$logfile where group#=1;
member
-------------------------------------------------------
d:/oracle/product/10.2.0/oradata/orcl/redo01.log
d:/oracle/product/10.2.0/oradata/orcl/redo05.log
删除新增的group 4
sql> alter database drop logfile group 4;
删除新增的group 1的logfile;
sql> alter database drop logfile member 'd:/oracle/product/10.2.0/oradata/orcl/redo05.log';
清空logfile:
sql> alter database clear logfile 'd:/oracle/product/10.2.0/oradata/orcl/redo01.log';
sql> select group#,sequence#,bytes,members,status from v$log;
group# sequence# bytes members status
---------- ---------- ---------- ---------- ----------------
1 17 52428800 1 active
2 18 52428800 1 current
3 0 52428800 1 unused
8. 设置control_file_record_keep_time 参数
该参数设置控制文件中存储备份记录的时间,在用rman的时候会涉及到这个参数。 备份记录包括完全的数据库备份记录,以及指定的数据文件,控制文件,参数文件和归档目录的备份记录。数据库参数control_file_record_keep_time以天为单位(默认值为7天),因此在默认情况下,oracle 会将rman备份和恢复记录保存7天。可以将该参数设置为0到365之间的任意值。
control_file_record_keep_time参数会影响一系列的数据库操作。 首先,产生rman备份时,由于与这些备份相关的记录存储在控制文件中,所以该参数直接影响数据库控制文件的大小。 备份记录将不断的保存在控制文件中,控制文件将耗尽空间。 这时,oracle 会扩展控制文件来调整备份记录所需的存储空间。 此外,设置为0时,将禁止扩展控制文件,并且会使得rman备份的保存周期不稳定。
建议将control_file_record_keep_time 参数设置为不小于选中数据库的备份保存周期,否则就可能在备份介质上有数据库备份,但是控制文件不存在与备份相关的备份记录,在这种情况下,将无法恢复这些较早的文件。这个参数根据自己的本份策略来决定。
sql> select name,value from v$parameter where name='control_file_record_keep_time';
name value
------------------------------ -------------------------------------------------
control_file_record_keep_time 7
sql> alter system set control_file_record_keep_time=20;
系统已更改。
sql> show parameter control_file_record_keep_time
name type value
------------------------------------ ----------- ------------------------------
control_file_record_keep_time integer 20
sql>
关于rman与control_file_record_keep_time的内容参考:
rman 系列(二) ---- rman 设置和配置
http://blog.csdn.net/tianlesoftware/archive/2010/06/16/5674309.aspx
9. 设置open_links_per_instance 和 open_links 参数
关于这2个参数的说明,参考blog:
open_links_per_instance 和 open_links 参数说明
http://blog.csdn.net/tianlesoftware/archive/2010/12/22/6090729.aspx
这2个参数修改之后,需要重启才能生效,所以,在安装db的时候,就把这个参数修改了。 默认值是4,如果用到话就太小了。 所以在安装的时候,就给修改了。 修改建议值:100。
sql> alter system set open_links=100 scope=spfile;
系统已更改。
10.修改用户的profile 参数
sql> alter profile default limit failed_login_attempts unlimited;
profile altered.
11.