Chinaunix首页 | 论坛 | 博客
  • 博客访问: 426298
  • 博文数量: 101
  • 博客积分: 1547
  • 博客等级: 上尉
  • 技术积分: 1072
  • 用 户 组: 普通用户
  • 注册时间: 2006-01-12 23:46
个人简介

music,code,dialog,rest

文章分类

全部博文(101)

文章存档

2023年(8)

2022年(25)

2021年(6)

2020年(2)

2019年(6)

2018年(4)

2017年(5)

2016年(20)

2015年(4)

2014年(2)

2013年(1)

2012年(1)

2011年(1)

2010年(1)

2009年(2)

2007年(10)

2006年(3)

分类: 大数据

2022-05-01 07:54:33

有时候,遇到 unicode decode 问题解决也非常麻烦。
现在总结一下,我常用的两个个方法,其中自认为效果非常好,而且比较通用。

#如果有特别字符无法用unicode表达,直接删除了之, 例如 \u30fb
outputstr = outputstr.replace("\u30fb","")

#一般比较通用的处理方式
import unicodedata
outputstr = unicodedata.normalize("NFKD", outputstr)

zenith 2022-05-01 闭关修炼中
阅读(1472) | 评论(0) | 转发(0) |
给主人留下些什么吧!~~