码迷,mamicode.com
首页 > 编程语言 > 详细

python处理汉字转拼音pypinyin

时间:2017-12-12 17:36:17      阅读:274      评论:0      收藏:0      [点我收藏+]

标签:process   body   www.   import   imp   author   默认   汉字   charm   

主要是pypinyin 包,官网:  http://pypinyin.readthedocs.io/zh_CN/master/index.html

jieba包,主要是用来分词的,我之前的博文有介绍:http://www.cnblogs.com/dahu-daqing/p/7491343.html

官网:    https://github.com/fxsjy/jieba/blob/master/README.md

 

就不细讲了,软件包都是中国人写的,官网也都是中文,看上去无压力。

放一下我的练习实例:

#!/usr/bin/env python
# -*- coding: utf-8 -*-
# Time    : 17-12-12 下午4:09
# Author  : dahu
# File    : t1pinyin.py
# Software: PyCharm

from pypinyin import lazy_pinyin,pinyin
from pypinyin.style import register
import sys
reload(sys)
sys.setdefaultencoding(utf-8)
@register(kiss)
def kiss(pinyin, **kwargs):
    return >{0}<.format(pinyin)
print 自定义格式\t\t,lazy_pinyin(u么么,style=kiss)
print 字符前加u\t\t,lazy_pinyin(u呵呵)
a=我的
print 变量的unicode形式\t\t,lazy_pinyin(unicode(a))
print 默认的输出格式\t\t,pinyin(unicode(a))

 结果:

/usr/bin/python2.7 /home/dahu/myfile/my_git/core-scrapy-learning/weiboresou/weiboresou/t1pinyin.py
自定义格式        [>me<, >me<]
字符前加u        [uhe, uhe]
变量的unicode形式        [uwo, ude]
默认的输出格式        [[uw\u01d2], [ude]]

Process finished with exit code 0

 

python处理汉字转拼音pypinyin

标签:process   body   www.   import   imp   author   默认   汉字   charm   

原文地址:http://www.cnblogs.com/dahu-daqing/p/8028419.html

(0)
(0)
   
举报
评论 一句话评论(0
登录后才能评论!
© 2014 mamicode.com 版权所有  联系我们:gaon5@hotmail.com
迷上了代码!