论文无忧网提供:计算机毕业论文范文|计算机毕业设计|计算机毕业论文
栏目导航 ASP JSP .NET VB6.0 JAVA VC VF DELPHI PB 计算机网络 计算机科学与技术 PHP 安卓APP 其他 代写论文

大学计算机基础教学网站设计—中文乱码问题分析及其解决方法

目 录

引 言. 1

http://www.paper51.com

一 计算机编码的相关知识. 1

内容来自www.paper51.com

1.1 字符编码的演变. 1 copyright paper51.com

1.2 常用字符编码. 1 paper51.com

二 JSP中文乱码的成因. 2

内容来自www.paper51.com

三 常见的中文乱码问题及解决办法. 3 内容来自www.paper51.com

3.1 中文乱码常见的表现形式. 3 paper51.com

3.2 JSP开发动态网站过程中常见的中文乱码问题及其解决方法. 7

内容来自www.paper51.com

3.2.1 JSP页面显示中文乱码. 7

内容来自论文无忧网 www.paper51.com

3.2.2 表单传递过程中出现中文乱码. 7

copyright paper51.com

3.2.3 读MySQL数据库时中文信息出现乱码. 9 copyright paper51.com

3.2.4 写MySQL数据库时中文信息出现乱码. 10 http://www.paper51.com

四 大学计算机基础教学网站设计过程中中文乱码的一整套解决方案. 10 copyright paper51.com

五 总结. 11 内容来自论文无忧网 www.paper51.com

六 结束语. 11 paper51.com

参考文献. 12

copyright paper51.com

致 谢. 12 http://www.paper51.com

内容来自论文无忧网 www.paper51.com

引 言

copyright paper51.com

当今社会,互联网技术蓬勃发展,动态网站开发技术也在不断更新。SUN公司跟随时代的发展,在Java的基础上开发出来的JSP动态网站开发技术实现了动态页面与静态页面的分离、脱离了硬件平台的束缚,大大提高了其执行效率而逐渐成为因特网上的主流开发工具。JSP网页是在传统的网页HTML文件中加入Java程序片段和JSP标记构成。JSP文件的核心语句是由Java程序片段组成,由于Java核心字符处理是基于UNICODE编码的,而简体中文是采用GBK或者GB2312编码,所以在基于JSP或Java进行应用开发时经常会出现中文乱码现象[3]。本文首先阐述了编码的相关知识,然后分析JSP网站开发过程中出现中文乱码的原因,最后,针对乱码产生的原因提出了相应的解决方法。

http://www.paper51.com

一 计算机编码的相关知识 内容来自论文无忧网 www.paper51.com

字符是各种文字和符号的总称,包括各个国家文字、标点符号、图形符号、数字等。字符集是多个字符的集合,字符集种类较多,每个字符集包含的字符个数不同,常见字符集名称有:ASCII字符集、GB2312字符集、BIG5字符集、 GB18030字符集、Unicode字符集等。计算机要准确的处理各种字符集文字,需要进行字符编码,以便计算机能够识别和存储各种文字。

内容来自www.paper51.com

1.1 字符编码的演变

paper51.com

计算机起源于美国,所以最初设计时只有128个字符的ASCII标准内码,只包含了英文字母。后来IBM设计出可以表示256个字符的ASCII内码,把欧洲文字也加了进去。后来发展成ISO8859系列编码,它包含的符号可使用于英语、丹麦语、芬兰语、德语、罗马尼亚语、波兰语等等。到了亚洲,这种256字符的编码无法满足需要,亚洲各国纷纷推出自己的字符编码,如中国的GBK 、GB2312,台湾省、香港地区的BIG5,日本的JIS,韩国KS系列编码,这让编码领域很混乱,为适应世界各民族的语言,提出了Unicode编码,它为每种语言中的每个字符设定了统一并且唯一的二进制编码,以满足跨语言、跨平台进行文本转换、处理的要求。Sun公司在最初开发Java语言的时候,就已经考虑到对非英文字符的支持了,所以Java内核是Unicode的。但Sun公司公布的Java运行环境(JRE)本身就分英文版和国际版,只有国际版才支持非英文字符。我们在基于JSP编程语言进行应用开发时,因为汉字字符集不只一个,而且不同的操作系统对汉字字符的支持也不尽相同,所以我们在进行应用开发中仍会遇到许多和汉字编码处理有关的问题。 paper51.com

1.2 常用字符编码 http://www.paper51.com

ASCII 字符集:它主要用于显示现代英语和其它西欧语言。包含:控制字符有:回车键、退格、换行键等;可显示字符有:英文大小写字符、阿拉伯数字和西文符号。 

paper51.com

GB2312 字符集:GB2312又称为GB2312-80字符集,是中国国家标准的简体汉字字符集。它所收录的汉字已经达到了汉字使用频率的99.75%,基本满足了汉字的计算机处理需要。 内容来自论文无忧网 www.paper51.com

GBK字符集:GBK字符集是GB2312的扩展(K),GBK1.0收录了21886个符号,它分为汉字区和图形符号区,汉字区包括21003个字符。GBK字符集主要扩展了繁体中文字的支持。

内容来自论文无忧网 www.paper51.com

GB18030 字符集:GB18030的全称是GB18030-2000《信息交换用汉字编码字符集基本集的扩充》,GB18030字符集标准解决了汉字、日文假名、朝鲜语和中国少数民族文字组成的大字符集计算机编码问题。该标准的字符总编码空间超过150万个编码位,收录了27484个汉字,覆盖中文、日文、朝鲜语和中国少数民族文字。能满足中国大陆、香港、台湾、日本和韩国等东亚地区信息交换多文种、大字量、多用途、统一编码格式的要求。GB18030字符集不仅与Unicode 3.0版本兼容,填补了Unicode扩展字符字汇“统一汉字扩展A”的内容,还与以前的国家字符编码标准(GB2312,GB13000.1)兼容。  

内容来自论文无忧网 www.paper51.com

Unicode字符集:Unicode字符集编码是通用多八位编码字符集的简称,支持世界上超过650种语言的国际字符集。Unicode允许在同一服务器上混合使用不同语言组的不同语言,支持现今世界各种不同语言的书面文本的交换、处理及显示。  

内容来自www.paper51.com

UTF-8编码:UTF-8是Unicode的其中一个使用方式。UTF是 Unicode Translation Format,即把Unicode转做某种格式的意思。UTF-8便于不同的计算机之间使用网络传输不同语言和编码的文字,使得双字节的Unicode能够在现存的处理单字节的系统上正确传输。UTF-8使用可变长度字节来储存 Unicode字符[11]。 内容来自www.paper51.com

------分隔线----------------------------
联系方式