swiftwwj 2019-11-08
在HTML中,中文的“好好学习”可以表示为 “好好学习”
在项目中,需要对接短信告警,短信告警返回数据要求是utf8的
后来继续沟通,才发现要的是html-utf8的;
没有找到合适的golang工具包,涉及语言转码的包主要有
mahonia,支持各种格式的数据转换,gbk,utf8,gb2312
net/html,支持网页转码,改的是转换网页中的<,>,&,‘,‘,.
根据网上经验,提供三个版本的转换
转换过程
Javascript
1 function ConvUtf8(obj) { 2 return obj.replace(/[^\u0000-\u00FF]/g, function ($0) { return escape($0).replace(/(%u)(\w{4})/gi, "&#x$2;") }); 3 }
JAVA
public static String UTF8_html_conv(String str){ StringBuffer stbPreemptionArg = new StringBuffer(); for(int i = 0;i<str.length();i++){ if (str.codePointAt(i) > 255){ stbPreemptionArg.append("&#x"+Integer.toString(str.charAt(i), 16)+";"); }else{ stbPreemptionArg.append(str.charAt(i)); } } return stbPreemptionArg.toString(); }
Golang
func CovertToHtml(src string) string{ rs := []rune(src) htmlUtf8 := "" for _, r := range rs { rint := int(r) if rint < 128 { htmlUtf8 += string(r) } else { //utf8 = "\\u"+strconv.FormatInt(int64(rint), 16) htmlUtf8 += "&#x"+strconv.FormatInt(int64(rint), 16) + ";" } } return htmlUtf8 }