软件下载 | 资讯教程 | 最近更新 | 下载排行 | 一键转帖 | 发布投稿
您的位置:最火下载站 > Web前端 > 工具与技巧 > invalid XML character (Unicode: 0x0)错误

invalid XML character (Unicode: 0x0)错误

  问题:复制/粘贴一段内容后保存时报invalid XML character (Unicode: 0x0)错误

  原因:多个系统间的Unicode编码在个别地方不一致,导致编码转换时出现问题。

  解决方法:

  1. 使用Christian Steinert [christian_steinert@web.de]修改的jtidy-8-svn-2006-05-21b.jar替换随OpenCms带的jtidy-r8-05102004.jar。jtidy-8-svn-2006-05-21b.jar可以从http://www.berzinarchives.com/temp/jtidy下载,修改jTidy源代码的方法说明在http://www.nabble.com/newer-version-of-JTidy-for-Opencms-6.21---fix-for%3A-%22invalid-XML-character-%28Unicode%3A-0x0%29%22---tf1873184.html#a5360720。
  2. 如果您找不到jtidy-8-svn-2006-05-21b.jar,可以点击这里从本网站下载。

  About Exception:
  An invalid XML character (Unicode: 0x0) was found in the element content of the document.

  问题描述:当我们用以下  

byte[] info ;
DocumentHelper.parseText(new String(info));

  将一个字节数组转成字符串再转成Document(XML格式)时,常常会遇到上述异常。特别是当字符串有加、解密,或编码等情况时。

  原因:从异常来看,很明显是因为字节数组中存在 Unicode: 0x0,而这个字节在Xml中被认为是非法字符。

  对于一些经过编码或加、解密的字符串中,很容易会出现这个 0x0,特别是在加、解密中,经常会涉及到字符填充,而填充物通常是 0x0,需对于0x00-0x20 都会引起一定的问题,又因为这些字符不可见,因此用通常的编辑器进行编辑的时候找不到问题所在。而在转成String后也觉察不到任何异常。

  所以在转成XML格式时要对字符串进行检测:

以下为引用的内容:
Verify that no character has a hex value greater than 0xFFFD, or less than 0x20.
* Check that the character is not equal to the tab ("t), the newline ("n), the carriage return ("r), or is an invalid XML character below the range of 0x20. If any of these characters occur, an exception is thrown.

pubic void CheckUnicodeString(String value)
    {
    for (int i=0; i < value.Length; ++i) {
        if (value[i] > 0xFFFD)
        {
            throw new Exception("Invalid Unicode");//或者直接替换掉0x0 value[i]='"n';
        }
        else if (value[i] < 0x20 && value[i] != '"t' & value[i] != '"n' & value[i] != '"r')
        {
            throw new Exception("Invalid Xml Characters");//或者直接替换掉0x0 value[i]='"n';
        }
    }

    相关阅读
    栏目导航
    推荐软件