码迷,mamicode.com
首页 > 编程语言 > 详细

python文本去除表情符

时间:2020-04-01 00:57:08      阅读:208      评论:0      收藏:0      [点我收藏+]

标签:utf-8   无法   文本   格式   comm   输出   nbsp   encoding   转化   

comment = “物流很快,昨晚下的单今天下午就到了??个人觉得特别百搭的一个颜色。”

str不具有decode属性,必须先将其转换为bytes,转化为bytes要制定其编码,然后将其utf8解码,然后再编码成gbk,同时备注‘ignore’属性,忽视无法编码的emoji,最后解码然后转换成str,便可输出到txt。

把其转化为gbk(方便txt保存)的编码格式,同时去除??。

comment = str(bytes(comment, encoding=utf-8).decode(utf-8).encode(gbk, ignore).decode(gbk))

 

python文本去除表情符

标签:utf-8   无法   文本   格式   comm   输出   nbsp   encoding   转化   

原文地址:https://www.cnblogs.com/qilin20/p/12609628.html

(0)
(0)
   
举报
评论 一句话评论(0
登录后才能评论!
© 2014 mamicode.com 版权所有  联系我们:gaon5@hotmail.com
迷上了代码!