关于替换“c2a0”十六进制字符的方法

一、背景:在爬取网络小说生成的文件中,发现有些空格没法替换,使用十六进制编辑器查看,发现这些空格字符的十六进制值是“c2a0”,其来源是网页控制的特殊字符,这是一个叫做Non-breaking space的东西,用于阻止在此处自动换行和阻止多个空格被压缩成一个。就是&nbsp。二、替换的有效方法:使
posted @ 2019-08-24 22:11  sfccl  阅读(1923)  评论(0编辑  收藏  举报