使用XML解析器
错误的写法:
- int start = xml.indexOf("<name>") + "<name>".length();
- int end = xml.indexOf("</name>");
- String name = xml.substring(start, end);
正确的写法:
- SAXBuilder builder = new SAXBuilder(false);
- Document doc = doc = builder.build(new StringReader(xml));
- String name = doc.getRootElement().getChild("name").getText();
请使用JDom组装XML
错误的写法:
- String name = ...
- String attribute = ...
- String xml = "<root>"
- +"<name att=\""+ attribute +"\">"+ name +"</name>"
- +"</root>";
正确的写法:
- Element root = new Element("root");
- root.setAttribute("att", attribute);
- root.setText(name);
- Document doc = new Documet();
- doc.setRootElement(root);
- XmlOutputter out = new XmlOutputter(Format.getPrettyFormat());
- String xml = out.outputString(root);
XML编码陷阱
错误的写法:
- String xml = FileUtils.readTextFile("my.xml");
因为xml的编码在文件中指定的,而在读文件的时候必须指定编码。另外一个问题不能一次就将一个xml文件用String保存,这样对内存会造成不必要的浪费,正确的做法用InputStream来边读取边处理。为了解决编码的问题, 最好使用XML解析器来处理。
未指定字符编码
错误的写法:
- Reader r = new FileReader(file);
- Writer w = new FileWriter(file);
- Reader r = new InputStreamReader(inputStream);
- Writer w = new OutputStreamWriter(outputStream);
- String s = new String(byteArray); // byteArray is a byte[]
- byte[] a = string.getBytes();
这样的代码主要不具有跨平台可移植性。因为不同的平台可能使用的是不同的默认字符编码。
正确的写法:
- Reader r = new InputStreamReader(new FileInputStream(file), "ISO-8859-1");
- Writer w = new OutputStreamWriter(new FileOutputStream(file), "ISO-8859-1");
- Reader r = new InputStreamReader(inputStream, "UTF-8");
- Writer w = new OutputStreamWriter(outputStream, "UTF-8");
- String s = new String(byteArray, "ASCII");
- byte[] a = string.getBytes("ASCII");
未对数据流进行缓存
错误的写法:
- InputStream in = new FileInputStream(file);
- int b;
- while ((b = in.read()) != -1) {
- ...
- }
上面的代码是一个byte一个byte的读取,导致频繁的本地JNI文件系统访问,非常低效,因为调用本地方法是非常耗时的。最好用 BufferedInputStream包装一下。曾经做过一个测试,从/dev/zero下读取1MB,大概花了1s,而用 BufferedInputStream包装之后只需要60ms,性能提高了94%! 这个也适用于output stream操作以及socket操作。
正确的写法:
- InputStream in = new BufferedInputStream(new FileInputStream(file));
无限使用heap内存
错误的写法:
- byte[] pdf = toPdf(file);
这里有一个前提,就是文件大小不能讲JVM的heap撑爆。否则就等着OOM吧,尤其是在高并发的服务器端代码。最好的做法是采用Stream的方式边读取边存储(本地文件或database)。
正确的写法:
另外,对于服务器端代码来说,为了系统的安全,至少需要对文件的大小进行限制。