Orace查询数据出现乱码的问题解决思路

问题描述

经常有些朋友会遇到,我明明是输入的正确中文,为什么我在另外一台电脑上查询却出现乱码啦?其实这个是数据库在进行字符集转换的时候出现了问题,

下面通过测试来描述具体的情况:

1.环境

oracle 数据库字符集:

connected to oracle database 11g enterprise edition release 11.2.0.1.0

connected as scott

sql> select * from database_properties where property_name = ‘nls_characterset’;

property_name property_value description

—————————— ——————————————————————————– ——————————————————————————

nls_characterset zhs16gbk character set

oracle 数据库所在的客服端字符集:

在注册表的:nls_lang=simplified chinese_china.zhs16gbk 如下图:

 

oracle 所在的操作系统的字符集:

microsoft windows [版本 6.1.7601]

版权所有 (c) 2009 microsoft corporation。保留所有权利。

c:\users\andy>chcp

活动代码页: 936

表示是:中国 – 简体中文(gb2312)

2.测试

字符集如下:

oracle 数据库字符集:zhs16gbk

oracle 数据库客户端字符集:zhs16gbk

操作系统字符集:中国 – 简体中文(gb2312)

输入测试数据:

sql> insert into tab_indx

2 values(1,’汉字输入字符集测试’,’chinese input test’,sysdate);

1 row inserted

字符集不修改,进行测试数据现实:

sql> select * from tab_indx where tid = 1;

tid tname tdesc sysdt

———- ——————————————————————————– ——————————————————————————– ———–

1 汉字输入字符集测试 chinese input test 2012/12/30

显示正常,

现在我把客服端的字符集修改为:utf8

及注册表的:nls_lang=simplified chinese_china.utf8

现在字符集如下:

oracle 数据库字符集:zhs16gbk

oracle 数据库客户端字符集:utf8

操作系统字符集:中国 – 简体中文(gb2312)

现在再查询刚才输入的数据:

sql> select tname,tdesc from tab_indx;

tname tdesc

——————————————————————————– ——————————————————————————–

发现查询出来的数据已经不能正常现实,因为这些汉字是以zhs16gbk编码格式存储的,然而你查询出来后根据oracle客服端的编码(utf8)转换,及转成了utf8的编码格式,但是操作系统是简体中文(gb2312),所以操作系统就把utf8编码格式的数据,当成简体中文(gb2312)的编码格式数据显示,结果就出现了乱码,

现在我再插入一笔数据:

sql> insert into tab_indx

2 values(1,’utf8下汉字输入字符集测试’,’chinese input test’,sysdate);

1 row inserted

再查询:

sql> select tname,tdesc from tab_indx;

tname tdesc

——————————————————————————– ——————————————————————————–

发现新插入的数据也出现了乱码,但是乱码跟刚才的值不一样??为什么呢?

因为输入的汉字,是简体中文(gb2312)的编码格式,当oracle数据库按照客户端的编码格式传给数据库,oracle数据库发现,oracle数据库客户端是utf8的编码格式,跟数据库的编码格式(zhs16gbk)不一样,就进行字符集转换,utf8–>zhs16gbk,所以把简体中文(gb2312)的编码格式的数据当成utf8,转为zhs16gbk的编码格式数据,就已经出错啦,查询出来自然转换回去就不行啦

(本来需要测试oracle数据库的字符集修改后的情况,这种情况暂时不测试)这里我们在把oracle客户的字符集修改回去;

在注册表的:nls_lang=simplified chinese_china.zhs16gbk


现在字符集如下

oracle 数据库字符集:zhs16gbk

oracle 数据库客户端字符集:zhs16gbk

操作系统字符集:中国 – 简体中文(gb2312)

再查询:

sql> select tname,tdesc from tab_indx;

tname tdesc

——————————————————————————– ——————————————————————————–


汉字输入字符集测试 chinese input test

utf8????????????? chinese input test

发现最开始输入的汉字正常啦,但是第二次输入的汉字,又变了,跟上次的乱码不一样????

虽然这里没有进行编码格式转换,但是上次在存数据的时候,已经是存的错误的编码格式,所以显示出来肯定不正确

其实还有好几种情况测试,由于本地环境的限制,所以测试的其它情况,大家可以去试试,如:数据库的字符集是utf8,然后客服端的字符集变化,对汉字的输入输出有什么影响

根据上面的测试情况和我自己的分析,现在总结如下:

1.数据库的查询出来的数据,是oracle数据库字符集,oracle客户端字符集,操作系统字符集共同作用的结果。

2.oracle存数据和查询数据都是通过oracle数据库的字符集和oracle客服端的字符集进行转换的,显示数据又是根据操作系统的字符集来确定的。

3.为了避免出现乱码必须要把oracle客户端的字符集和操作系统的字符集设置成一样的。

(0)
上一篇 2022年3月22日
下一篇 2022年3月22日

相关推荐