码迷,mamicode.com
首页 > 其他好文 > 详细

删除utf8范围之外的数据

时间:2019-09-19 10:30:19      阅读:96      评论:0      收藏:0      [点我收藏+]

标签:error   code   correct   地方   删除   ror   int   data   syntax   

报错:SyntaxError:Non-UTF-8 code starting with ‘\x..‘ in file ...

1 #获得没法识别的字节错误:"Incorrect string value:‘\\xF0\\xAB\\x96\\xAF\\xE7\\x9A...‘,把字节错误的地方换成?
2 errorbytes = [b\xF0\xAB\x96\xAF\xE7\x9A,b\xF0\xA8\xA8\x97\xEF\xBC]
3 for eb in errorbytes:
4     data[intro] = [x.encode(utf8, errors=replace).replace(eb, b?).decode(utf8
5                      , errors=replace) for x in list(data[intro])]

 

删除utf8范围之外的数据

标签:error   code   correct   地方   删除   ror   int   data   syntax   

原文地址:https://www.cnblogs.com/xl717/p/11547266.html

(0)
(0)
   
举报
评论 一句话评论(0
登录后才能评论!
© 2014 mamicode.com 版权所有  联系我们:gaon5@hotmail.com
迷上了代码!