今天的早些时候,Node.js发布了一个更新,它会影响到转化到缓冲区中的无效UTF-8字符串的处理。我又得去检查一遍websocket-driver的中UTF-8校验的代码了,并且我发现自己又忘记了如何使用正则去进行校验了。我先把它从网页上拷贝了下来,过了一会儿才终于彻底搞明白它的工作原理了。如果你写的程序是进行文本处理的,你很可能也需要了解这个,因此我觉得我应该把它给写下来。 首先你需要知道的是Unicode和UTF-8并不是一回事。Unicode是一个标准,它的目标是将有限的数字分配给全世界书写系统中的所有字符及文字。比如说,数字65,或者说U+
2014-11-11 13:46
分享到微信
打开微信,点击顶部的“╋”,
使用“扫一扫”将网页分享至微信。