每天都有新的故事发生!



 
    
 
                                                         
 
    

诊断ORA-04031 错误

作者[viviliving] 发表于[2005-11-9 17:30:00]

1.共享池相关的实例参数
  在继续之前,理解下面的实例参数是很重要的:
  
  SHARED_POOL_SIZE – 这个参数指定了共享池的大小,单位是字节。可以接受数字值或者数字后面跟上后缀"K" 或 "M" 。"K"代表千字节, "M"代表兆字节。
  
  SHARED_POOL_RESERVED_SIZE – 指定了为共享池内存保留的用于大的连续请求的共享池空间。当共享池碎片强制使Oracle 查找并释放大块未使用的池来满足当前的请求的时候,这个参数和SHARED_POOL_RESERVED_MIN_ALLOC 参数一起可以用来避免性能下降。
  
  这个参数理想的值应该大到足以满足任何对保留列表中内存的请求扫描而无需从共享池中刷新对象。既然操作系统内存可以限制共享池的大小,一般来说,你应该设定这个参数为SHARED_POOL_SIZE 参数的 10% 大小。
  
  SHARED_POOL_RESERVED_MIN_ALLOC –这个参数的值控制保留内存的分配。如果一个足够尺寸的大块内存在共享池空闲列表中没能找到,内存就从保留列表中分配一块比这个值大的空间。默认的值对于大多数系统来说都足够了。如果你加大这个值,那么Oracle 服务器将允许从这个保留列表中更少的分配并且将从共享池列表中请求更多的内存。这个参数在Oracle 8i 是隐藏的。
  

2  诊断ORA-04031 错误

首先判定是否ORA-04031 错误是由共享池保留空间中的库高速缓冲的碎片产生的。提交下的查 询:
  
  SELECT free_space, avg_free_size, used_space, avg_used_size,
  request_failures, last_failure_size
  FROM v$shared_pool_reserved;
  
  如果:
  
  REQUEST_FAILURES > 0 并且
  LAST_FAILURE_SIZE > SHARED_POOL_RESERVED_MIN_ALLOC
  
  那么ORA-04031 错误就是因为共享池保留空间缺少连续空间所致。
  要解决这个问题,可以考虑加大SHARED_POOL_RESERVED_MIN_ALLOC 来降低缓冲进共 享池保留空间的对象数目,并增大 SHARED_POOL_RESERVED_SIZE 和SHARED_POOL_SIZE 来加大共享池保留空间的可用内存。
  
  如果:
  REQUEST_FAILURES > 0 并且
  LAST_FAILURE_SIZE < SHARED_POOL_RESERVED_MIN_ALLOC
  
  或者
  
  REQUEST_FAILURES 等于0 并且
  LAST_FAILURE_SIZE < SHARED_POOL_RESERVED_MIN_ALLOC
  
  那么是因为在库高速缓冲缺少连续空间导致ORA-04031 错误。
  
  第一步应该考虑降低SHARED_POOL_RESERVED_MIN_ALLOC 以放入更多的对象到共享池保留空间中并且加大SHARED_POOL_SIZE。

 3.解决ORA-04031 错误
  ? ORACLE BUG
  要解决这个错误(如果可以称得上错误的话),进行的诊断的第一步是在你的平台上使用最新的补丁集。大多数的ORA-04031错误都和BUG 相关,可以通过使用这些补丁来避免。

 BUG 描述 Workaround Fixed 
  <Bug:1397603> ORA-4031/SGA memory leak of PERMANENT memory occurs for buffer handles _db_handles_cached = 0 901/ 8172 
  <Bug:1640583> ORA-4031 due to leak / cache buffer chain contention from AND-EQUAL access Not available 8171/901 
  <Bug:1318267> INSERT AS SELECT statements may
  not be shared when they should be
  if TIMED_STATISTICS. It can lead to ORA-4031 _SQLEXEC_PROGRESSION_COST=0
   8171/8200 
  <Bug:1193003> Cursors may not be shared in 8.1
  when they should be Not available 8162/8170/ 901 
  
  共享池结构中的一些BUG 会引起这个错误,不过通常大量的共享的SQL/PLSQL 语句也会引起这个错误。一旦打过了最新的补丁,在遇到这个问题的时候我们强烈推荐调整数据库和应用。

如果SHARED_POOL_SIZE 足够大,大多数的 ORA-04031 错误都是由共享池中的动态SQL碎片导致的。可能的原因如下:
  
  ◇非共享的SQL
  ◇生成不必要的解析调用 (软解析)
  ◇没有使用绑定变量
  
  要减少碎片的产生你需要确定是前面描叙的几种可能的因素。可以采取如下的一些方法,当然不只局限于这几种: 应用调整、数据库调整或者实例参数调整。
  
  下面的视图有助于你标明共享池中非共享的SQL/PLSQL:
  
  V$SQLAREA 视图
  
  这个视图保存了在数据库中执行的SQL 语句和PL/SQL 块的信息。下面的SQL 语句可以显示给你带有literal 的语句或者是带有绑定变量的语句:
  
  SELECT substr(sql_text,1,40) "SQL", count(*) , sum(executions) "TotExecs"
  FROM v$sqlarea
  WHERE executions < 5
  GROUP BY substr(sql_text,1,40)
  HAVING count(*) > 30
  ORDER BY 2;
  
  注意: 语句Having 中的 "30"数值可以根据需要调整以得到更为详细的信息。
  
  X$KSMLRU 视图
  
  有一个固定表x$ksmlru 跟踪共享池中导致其它对象换出(age out)的应用。这个固定表可以用来标记是什么导致了大的应用。
  
  如果很多对象在共享池中都被阶段性的刷新可能导致响应时间问题并且有可能在对象重载入共享池中的时候导致库高速缓冲闩竞争问题。
  
  关于这个x$ksmlru 表的一个不寻常的地方就是如果有人从表中选取内容这个表的内容就会被擦除。这样这个固定表只存储曾经发生的最大的分配。这个值在选择后被重新设定这样接下来的大的分配可以被标记,即使它们不如先前的分配过的大。因为这样的重置,在查询提交后的结果不可以再次得到,从表中的输出的结果应该小心的保存。监视这个固定表运行如下操作:
  
  SELECT * FROM X$KSMLRU WHERE ksmlrsiz > 0;
  
  在Oracle8i 中这个表不能被SYS用户之外的用户所选取。
  
  ? 小的共享池尺寸
  
  最后,一个小的共享池可以导致ORA-04031 错误, 不过在碎片真正的是个问题的时候增大共享池的大小的时候要小心。在错误发现的时候通常有延迟现象,不过当在大的共享池的碎片中找到一片空闲的内存会加大对性能的影响。
  
  下面的信息将有助于你调整共享池的大小:
  
  库高速缓冲命中率
  命中率有助于你衡量共享池的使用,基于多少次SQL/PLSQL 需要被解析而不是重用。下面的SQL 语句有助于你计算库高速缓冲的命中率:
  
  SELECT SUM(PINS) "EXECUTIONS",
  SUM(RELOADS) "CACHE MISSES WHILE EXECUTING"
  FROM V$LIBRARYCACHE;
  
  如果misses 比上executions 大于1%, 那就应该尝试着通过加大共享池来减少库高速缓冲的丢失。
  
  Shared Pool Size Calculation
  
  要计算最适合当前工作负荷的共享池大小,参考:
  
  <Note:1012046.6>: HOW TO CALCULATE YOUR SHARED POOL SIZE.
  
  4.对ORA-04031 的高级分析
  如果使用如上的解决办法,这个错误仍然出现,在initSID.ora 文件中设定如下的事件并重新启动实例:
  
  event = "4031 trace name errorstack level 3"

Re:诊断ORA-04031 错误

作者[viviliving] 发表于[2005-11-9 17:35:00]

应用过程中总是出现ORA-04031错误,采用该方法后运行2个月没有再次出现过该错误。

可以提交一个JOB来自动运行这个过程。

可以将存储过程先钉在缓冲区中。但是现在还不知道如何将字典缓冲区的内容也钉起来,望各位大侠告之:)

create or replace procedure AUTO_PIN is
address varchar2(20); --sql_address
hashvalue varchar2(20); --sql_hashvalue

SumMemory number; --SQL缓冲区总空间
PinMemory number; --钉在SQL缓冲区的空间

cursor cSele_SQL is --查询执行过100次的SQL
select t.ADDRESS,t.HASH_VALUE
from v$sql t
where t.KEPT_VERSIONS=0
and t.EXECUTIONS>100
order by t.EXECUTIONS desc;
begin
select nvl(sum(t.SHARABLE_MEM),0) --查询钉住的SQL所占空间
into PinMemory
from v$sql t
where t.KEPT_VERSIONS<>0;

select sum(t.SHARABLE_MEM) --查询总空间
into SumMemory
from v$sql t;

if PinMemory/SumMemory<0.7 then --小于70%
open cSele_SQL;
fetch cSele_SQL into address,hashvalue;

while cSele_SQL%found loop
-- dbms_output.put_line(address||','||hashvalue);

sys.dbms_shared_pool.keep(address||','||hashvalue,'C'); --钉SQL

fetch cSele_SQL into address,hashvalue;
end loop;
close cSele_SQL;
else --大于70%
execute immediate 'alter system flush shared_pool'; --刷新SHARED_POOL
end if;
end AUTO_PIN;

附件: auto_pin.txt

发表评论:[拥有一个自己的Blog?]

    昵称:
    密码: (游客无须输入密码)
    主页:
    标题:
    正在读取数据……
     
Powered by oBlog.cn