阅读量:159
在Java中处理UTF字符串有多种方法
- 声明文件编码为UTF-8: 确保在处理UTF-8字符串时,文件本身是以UTF-8编码保存的。在源代码文件的开头添加以下声明:
// -*- coding: utf-8 -*-
或者
// coding=utf-8
- 使用String对象: Java中的String对象默认使用UTF-16编码,可以表示Unicode字符。创建一个String对象时,可以直接指定UTF-8编码的字符串:
String utf8String = new String("你好,世界!", "UTF-8");
- 使用BufferedReader和PrintWriter处理UTF-8字符串: 当需要从输入流中读取UTF-8编码的字符串或将字符串写入输出流时,可以使用BufferedReader和PrintWriter类。
读取UTF-8字符串:
import java.io.BufferedReader;
import java.io.FileReader;
import java.io.IOException;
public class ReadUtf8 {
public static void main(String[] args) {
try (BufferedReader br = new BufferedReader(new FileReader("input.txt", "UTF-8"))) {
String line;
while ((line = br.readLine()) != null) {
System.out.println(line);
}
} catch (IOException e) {
e.printStackTrace();
}
}
}
写入UTF-8字符串:
import java.io.BufferedWriter;
import java.io.FileWriter;
import java.io.IOException;
public class WriteUtf8 {
public static void main(String[] args) {
try (BufferedWriter bw = new BufferedWriter(new FileWriter("output.txt"))) {
bw.write("你好,世界!");
bw.newLine();
} catch (IOException e) {
e.printStackTrace();
}
}
}
- 使用Java 8及以上版本的Files类和Paths类处理UTF-8文件:
import java.nio.charset.StandardCharsets;
import java.nio.file.Files;
import java.nio.file.Path;
import java.nio.file.Paths;
import java.util.List;
public class Utf8FileExample {
public static void main(String[] args) {
Path path = Paths.get("example.txt");
// 读取UTF-8文件
List lines;
try {
lines = Files.readAllLines(path, StandardCharsets.UTF_8);
for (String line : lines) {
System.out.println(line);
}
} catch (IOException e) {
e.printStackTrace();
}
// 写入UTF-8文件
String content = "你好,世界!";
try {
Files.write(path, content.getBytes(StandardCharsets.UTF_8));
} catch (IOException e) {
e.printStackTrace();
}
}
}
这些方法可以帮助您在Java中处理UTF-8字符串。注意在处理文件时始终指定编码,以避免出现编码相关的问题。