HTML 实体解析器Java
文章发布较早,内容可能过时,阅读注意甄别。
# 题目
「HTML 实体解析器」 是一种特殊的解析器,它将 HTML 代码作为输入,并用字符本身替换掉所有这些特殊的字符实体。
HTML 里这些特殊字符和它们对应的字符实体包括:
- 双引号:字符实体为 " ,对应的字符是 " 。
- 单引号:字符实体为 ' ,对应的字符是 ' 。
- 与符号:字符实体为 & ,对应对的字符是 & 。
- 大于号:字符实体为 > ,对应的字符是 > 。
- 小于号:字符实体为 < ,对应的字符是 < 。
- 斜线号:字符实体为 ⁄ ,对应的字符是 / 。 给你输入字符串 text ,请你实现一个 HTML 实体解析器,返回解析器解析后的结果。
示例 1:
输入:text = "& is an HTML entity but &ambassador; is not."
输出:"& is an HTML entity but &ambassador; is not."
解释:解析器把字符实体 & 用 & 替换
示例 2:
输入:text = "and I quote: "...""
输出:"and I quote: \"...\""
示例 3:
输入:text = "Stay home! Practice on Leetcode :)"
输出:"Stay home! Practice on Leetcode :)"
示例 4:
输入:text = "x > y && x < y is always false"
输出:"x > y && x < y is always false"
示例 5:
输入:text = "leetcode.com⁄problemset⁄all"
输出:"leetcode.com/problemset/all"
提示:
- 1 <= text.length <= 10^5
- 字符串可能包含 256 个ASCII 字符中的任意字符。
# 思路
StringBuilder
# 解法
class Solution {
public String entityParser(String text) {
int index=0;
StringBuilder sb=new StringBuilder();
while (index<text.length()){
if(text.charAt(index)=='&'){
if(index<text.length()-5&&text.substring(index,index+6).equals(""")){
sb.append('"');
index=index+6;
}else if(index<text.length()-5&&text.substring(index,index+6).equals("'")){
sb.append("'");
index=index+6;
}else if(index<text.length()-4&&text.substring(index,index+5).equals("&")){
sb.append('&');
index=index+5;
}else if(index<text.length()-3&&text.substring(index,index+4).equals(">")){
sb.append('>');
index=index+4;
} else if(index<text.length()-3&&text.substring(index,index+4).equals("<")){
sb.append('<');
index=index+4;
}else if(index<text.length()-6&&text.substring(index,index+7).equals("⁄")){
sb.append('/');
index=index+7;
}else {
sb.append(text.charAt(index));
index++;
}
}else {
sb.append(text.charAt(index));
index++;
}
}
return new String(sb);
}
}
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
# 总结
- 分析出几种情况,然后分别对各个情况实现