[20190910]索引分支块中TERM使用什么字符表示.txt

[20190910]索引分支块中term使用什么字符表示.txt

–//做索引块转储,一些root,分支节点出现term,从来没有关注使用字符表示,简单探究看看。

1.环境:
scott@test01p> @ ver1

port_string                    version        banner                                                                               con_id
—————————— ————– ——————————————————————————– ———-
ibmpc/win_nt64-9.1.0           12.2.0.1.0     oracle database 12c enterprise edition release 12.2.0.1.0 – 64bit production              0

scott@test01p> create table t as select to_char(rownum,’fm’||lpad(‘0′,20,’0’)) v1 from dual connect by level<=2000;
table created.

scott@test01p> create index i_t_v1 on t(v1);
index created.

scott@test01p> select header_file,header_block from dba_segments where owner=user and segment_name=’i_t_v1′;
header_file header_block
———– ————
         11          506

scott@test01p> @ treedump i_t_v1
old   1: select object_id from user_objects where object_name = upper(‘&&1’) and object_type = ‘index’
new   1: select object_id from user_objects where object_name = upper(‘i_t_v1’) and object_type = ‘index’
 object_id
———-
     27931

old   1: alter session set events ‘immediate trace name treedump level &m_index_id’
new   1: alter session set events ‘immediate trace name treedump level      27931’
session altered.        

2.检查转储:
–//转储内容:
—– begin tree dump
branch: 0x2c001fb 46137851 (0: nrow: 9, level: 1)

*** 2019-09-10t20:55:45.660043+08:00 (test01p(3))
   leaf: 0x2c001fc 46137852 (-1: row:224.224 avs:832)
   leaf: 0x2c001fd 46137853 (0: row:224.224 avs:832)
   leaf: 0x2c001fe 46137854 (1: row:224.224 avs:832)
   leaf: 0x2c001ff 46137855 (2: row:224.224 avs:832)
   leaf: 0x2c003e0 46138336 (3: row:224.224 avs:832)
   leaf: 0x2c003e1 46138337 (4: row:224.224 avs:832)
   leaf: 0x2c003e2 46138338 (5: row:224.224 avs:832)
   leaf: 0x2c003e3 46138339 (6: row:224.224 avs:832)
   leaf: 0x2c003e4 46138340 (7: row:208.208 avs:1344)
—– end tree dump

–//0x2c001fb  = set dba 11,507 = alter system dump datafile 11 block 507
–//转储root节点.

scott@test01p> alter system checkpoint ;
system altered.

scott@test01p> alter system dump datafile 11 block 507;
system altered.

–//转储内容:
block header dump:  0x02c001fb
 object id on block? y
 seg/obj: 0x6d1b  csc:  0x0000000000a2b4d9  itc: 1  flg: e  typ: 2 – index
     brn: 0  bdba: 0x2c001f8 ver: 0x01 opc: 0
     inc: 0  exflg: 0
 
 itl           xid                  uba         flag  lck        scn/fsc
0x01   0xffff.000.00000000  0x00000000.0000.00  c—    0  scn  0x0000000000a2b4d9
branch block dump
=================
header address 629538892=0x2586004c
kdxcolev 1
kdxcolev flags = – – –
kdxcolok 0
kdxcoopc 0x80: opcode=0: iot flags=— is converted=y
kdxconco 2
kdxcosdc 0
kdxconro 8
kdxcofbo 44=0x2c
kdxcofeo 7852=0x1eac
kdxcoavs 7808
kdxbrlmc 46137852=0x2c001fc
kdxbrsno 0
kdxbrbksz 8060
kdxbr2urrc 0
row#0[8034] dba: 46137853=0x2c001fd
col 0; len 20; (20):  30 30 30 30 30 30 30 30 30 30 30 30 30 30 30 30 30 32 32 35
–//30 30 30 30 30 30 30 30 30 30 30 30 30 30 30 30 30 32 32 35 = 00000000000000000225
col 1; term
–//出现term.
row#1[8008] dba: 46137854=0x2c001fe
col 0; len 20; (20):  30 30 30 30 30 30 30 30 30 30 30 30 30 30 30 30 30 34 34 39
col 1; term
row#2[7982] dba: 46137855=0x2c001ff
col 0; len 20; (20):  30 30 30 30 30 30 30 30 30 30 30 30 30 30 30 30 30 36 37 33
col 1; term
row#3[7956] dba: 46138336=0x2c003e0
col 0; len 20; (20):  30 30 30 30 30 30 30 30 30 30 30 30 30 30 30 30 30 38 39 37
col 1; term
row#4[7930] dba: 46138337=0x2c003e1
col 0; len 20; (20):  30 30 30 30 30 30 30 30 30 30 30 30 30 30 30 30 31 31 32 31
col 1; term
row#5[7904] dba: 46138338=0x2c003e2
col 0; len 20; (20):  30 30 30 30 30 30 30 30 30 30 30 30 30 30 30 30 31 33 34 35
col 1; term
row#6[7878] dba: 46138339=0x2c003e3
col 0; len 20; (20):  30 30 30 30 30 30 30 30 30 30 30 30 30 30 30 30 31 35 36 39
col 1; term
row#7[7852] dba: 46138340=0x2c003e4
col 0; len 20; (20):  30 30 30 30 30 30 30 30 30 30 30 30 30 30 30 30 31 37 39 33
col 1; term
—– end of branch block dump —–
end dump data blocks tsn: 4 file#: 11 minblk 507 maxblk 507

–//转储可以发现term,表示终结,也就是叶子节点并不需要保存完整键值,仅仅部分就ok了。
–//当然这里看不出来term的对应编码.看转储文件前面的内容如下:

dump of memory from 0x0000000025860000 to 0x0000000025862000
025860000 0000a206 02c001fb 00a2b4dd 04010000  […………….]
025860010 0000afcd 00000002 00006d1b 00a2b4d9  [………m……]
025860020 00008000 00320001 02c001f8 0000ffff  [……2………]
025860030 00000000 00000000 00000000 80008000  […………….]
025860040 00a2b4d9 00000000 00000000 02800001  […………….]
025860050 00000000 002c0008 1e801eac 02c001fc  [……,………]
025860060 00000000 00001f7c 1f481f62 1f141f2e  [….|…b.h…..]
025860070 1ee01efa 1eac1ec6 00000000 00000000  […………….]
025860080 00000000 00000000 00000000 00000000  […………….]
        repeat 486 times
025861ef0 00000000 00000000 02c003e4 30303014  [………….000]
025861f00 30303030 30303030 30303030 39373130  [0000000000000179]
025861f10 03e3fe33 301402c0 30303030 30303030  [3……000000000]
025861f20 30303030 31303030 fe393635 02c003e2  [00000001569…..]
025861f30 30303014 30303030 30303030 30303030  [.000000000000000]
025861f40 34333130 03e1fe35 301402c0 30303030  [01345……00000]
025861f50 30303030 30303030 31303030 fe313231  [000000000001121.]
025861f60 02c003e0 30303014 30303030 30303030  […..00000000000]
025861f70 30303030 39383030 01fffe37 301402c0  [000000897……0]
025861f80 30303030 30303030 30303030 30303030  [0000000000000000]
025861f90 fe333736 02c001fe 30303014 30303030  [673……0000000]
025861fa0 30303030 30303030 34343030 01fdfe39  [0000000000449…]
025861fb0 301402c0 30303030 30303030 30303030  […0000000000000]
025861fc0 30303030 fe353232 00000000 00000000  [0000225………]
                   ~~~~~~~~
025861fd0 00000000 00000000 00000000 00000000  […………….]
        repeat 1 times
025861ff0 00000000 00000000 00000000 b4dd0601  […………….]

–//注意看下划线内容可以知道term对应编码是0xfe.
–//当然我的例子特殊,如果上面的索引建立唯一索引就不会出现这样的情况,因为这样rowid在索引键值的前面。

3.bbed观察看看:
bbed> set dba 11,508
        dba             0x02c001fc (46137852 11,508)
–//注:windows下的bbed块出现偏移要+1.

bbed> p kd_off
b2 kd_off[0]    @100      8060
b2 kd_off[1]    @102      0
b2 kd_off[2]    @104      8034
b2 kd_off[3]    @106      8008
b2 kd_off[4]    @108      7982
b2 kd_off[5]    @110      7956
b2 kd_off[6]    @112      7930
b2 kd_off[7]    @114      7904
–//bbed看索引结构有一些问题,kd_off[0],kd_off[1]指向的偏移不对.实际上从kd_off[2]开始.

bbed> x /rcx *kd_off[2]
rowdata[186]                                @8110
————
child dba:     0x02c001fd
separator key:
col   0[20] @8115: 00000000000000000225
col    1[0] @8136: *term*

bbed> x /rcx *kd_off[3]
rowdata[160]                                @8084
————
child dba:     0x02c001fe
separator key:
col   0[20] @8089: 00000000000000000449
col    1[0] @8110: *term*
—//这里的偏移有问题.偏移8110是下一条记录的开始,估计是bbed的bug.

bbed> dump /v offset 8110
 file: d:\app\oracle\oradata\test\test01p\users01.dbf (11)
 block: 508                               offsets: 8110 to 8191                            dba:0x02c001fc
———————————————————————————————————–
 fd01c002 14303030 30303030 30303030 30303030 30303232 35fe0000 00000000 l ??.00000000000000000225?…..
 00000000 00000000 00000000 00000000 00000000 00000000 00000000 00000000 l …………………………..
 00000000 00000000 00000000 00000106 ddb4                                l …………….荽
 <32 bytes per line>

bbed> x /rcx offset 8110
rowdata[186]                                @8110
————
child dba:     0x02c001fd
separator key:
col   0[20] @8115: 00000000000000000225
col    1[0] @8136: *term*

bbed> dump /v offset 8109 count 2
 file: d:\app\oracle\oradata\test\test01p\users01.dbf (11)
 block: 508                               offsets: 8109 to 8110                            dba:0x02c001fc
———————————————————————————————————–
 fefd                                                                    l 
 <32 bytes per line>

–//bbed显示的x命令显示col 1的偏移有问题,实际上列长度是0.偏移8110是另一条记录.
–//可以发现term实际上对应ascii码是0xfe。这样就很好解析我以前遇到的问题。链接:
–//http://blog.itpub.net/267265/viewspace-1291526/=>[20141008]索引字符串的长度问题.txt

–//对于索引字符串的长度:
–//1.当字符串长度小于等于127时,使用1个字节表示长度.
–//2.当字符串大于等于128时,使用2个字节来保存长度,内容为字符串长度+0x8000.
–//3.真搞不懂为什么与数据块的保存方式不同,oracle要创造2种不同的方式保存字符串.

–//当时很不理解为什么oracle要创造2种不同的方式保存字符串,现在明白了。

–//曾经写过一篇”varchar2(4000)如何保存”,链接如下:
–//http://blog.itpub.net/267265/viewspace-2148818/ => [20171218]varchar2(4000)如何保存.txt

–//如果一行能被存储于一个数据块(data block)中,那么其行头(row header)所需容量将不少于 3 字节(byte)。在行头信息之后依次储存
–//的是各列的列长(column length)及列值(column value)。列长存储于列值之前,如列值不超过250 字节,那么 oracle使用1字节存储其
–//列长;如列值超过 250 字节,则使用 3 字节存储其列长。列数据(column data)所需的存储空间取决于此列的数据类型(datatype)。如
–//果某列的数据类型为变长(variable length)的,那么存储此列值所需的空间可能会随着数据更新而增长或缩小。

–//当时的总结:
–//1.如果列值长度小于等于250字节,oracle使用1字节存储其列长.内容为字段的长度.
–//2.如果列值长度超过250字节,则使用3字节存储其列长。前面1个字节使用0xfe(表示超过250),后面2个字节表示列值长度.

–//很明显0xfe在数据块中的字符串长度指示器一部分,用来表示保存字符超过250字节。而索引term使用0xfe表示。
–//这样索引字段字符串长度如果大于250,就不能再使用数据块中类似的方式保存键值长度。这样oraclea必须采用新的模式定义索引中字符串长度.
–//语言不好表达,还是通过例子说明:

4.继续测试:
create table t1 (v1 varchar2(4000));
insert into t1 values (lpad(‘1′,127,’1’));
insert into t1 values (lpad(‘2′,128,’2’));
insert into t1 values (lpad(‘3′,4000,’3’));
commit ;
create index i_t1_v1 on t1(v1);
alter system checkpoint ;

scott@test01p> select header_file,header_block from dba_segments where owner=user and segment_name=’i_t1_v1′;
header_file header_block
———– ————
         11          410

–//索引根节点在11,411.通过bbed观察:

bbed> set dba 11,412
        dba             0x02c0019c (46137756 11,412)

bbed> p kd_off
b2 kd_off[0]  @132      8036
b2 kd_off[1]  @134      0
b2 kd_off[2]  @136      7899

bbed> x /rcx *kd_off[2]
rowdata[4154]                               @7999
————-
flag@7999:     0x00 (none)
lock@8000:     0x00
data key:
col  0[127] @8002: 11111111…1111111111
col    1[6] @8130:  0x02  0xc0  0x01  0x95  0x00  0x00

bbed> dump /v offset 8001 count 10
 file: d:\app\oracle\oradata\test\test01p\users01.dbf (11)
 block: 412                               offsets: 8001 to 8010                            dba:0x02c0019c
———————————————————————————————————–
 7f313131 31313131 3131                                                  l .111111111
<32 bytes per line>

–//7f = 127 ,使用1个字节表示字符串长度.

bbed> dump /v offset 138 count 4
 file: d:\app\oracle\oradata\test\test01p\users01.dbf (11)
 block: 412                               offsets:  138 to  141                            dba:0x02c0019c
———————————————————————————————————–
 501ea50e                                                                l p.?
<32 bytes per line>

–//字节颠倒顺序 0x1e50 = 7760, 0x0ea5 = 3749 .相对偏移在7760,3749,看前面kd_off[2]偏移可以看出绝对偏移要加100.

bbed> x /rcx offset 7860
rowdata[4015]                               @7860
————-
flag@7860:     0x00 (none)
lock@7861:     0x00
data key:
col  0[128] @7864: 22222…22222
col    1[6] @7993:  0x02  0xc0  0x01  0x95  0x00  0x01

bbed> dump /v offset 7862 count 10
 file: d:\app\oracle\oradata\test\test01p\users01.dbf (11)
 block: 412                               offsets: 7862 to 7871                            dba:0x02c0019c
———————————————————————————————————–
 80803232 32323232 3232                                                  l ..22222222
<32 bytes per line>
–//出现2次0x80.

bbed> x /rcx offset 3849
rowdata[4]                                  @3849
———-
flag@3849:     0x00 (none)
lock@3850:     0x00
data key:
col 0[4000] @3853: 3333…………
……..3333333
col    1[6] @7854:  0x02  0xc0  0x01  0x95  0x00  0x02

bbed> dump /v offset 3851 count 10
 file: d:\app\oracle\oradata\test\test01p\users01.dbf (11)
 block: 412                               offsets: 3851 to 3860                            dba:0x02c0019c
———————————————————————————————————–
 8fa03333 33333333 3333                                                  l .?3333333
 <32 bytes per line>

–//0x8fa0 -0x8000 = 0xfa0 = 4000.

–//对于索引字符串的长度:
–//1.当字符串长度小于等于127时,使用1个字节表示长度.
–//2.当字符串大于等于128时,使用2个字节来保存长度,内容为字符串长度+0x8000.

–//以前学习oracle很不理解为什么数据块中字串长度小于等于250字节,oracle使用1字节存储其列长.内容为字段的长度.
–//为什么把边界定义在250. 0xff用来保存空值,0xfe作为>250字串长度指示器编码一部分(在索引表示term).
–//按照这样的道理,oracle还预留了0xfb,0xfc,0xfd,不知道在那里会用上….

(0)
上一篇 2022年3月22日
下一篇 2022年3月22日

相关推荐