将汉语转为拼音。可以用于汉字注音、排序、检索。基于 pinyinjs 开发。
>>> from pypinyin import pinyin
>>> import pypinyin
>>> pinyin(u'中心')
[[u'zh\u014dng'], [u'x\u012bn']]
>>> pinyin(u'中心', heteronym=True) # 启用多音字模式
[[u'zh\u014dng', u'zh\xf2ng'], [u'x\u012bn']]
>>> pinyin(u'中心', pypinyin.STYLE_INITIALS) # 设置拼音风格
[['zh'], ['x']]
拼音风格:
pypinyin.STYLE_NORMAL | 普通风格,不带声调。如:pin yin |
pypinyin.STYLE_TONE | 声调风格,拼音声调在韵母第一个字母上(默认风格)。如:pīn yīn |
pypinyin.STYLE_TONE2 | 声调风格2,即拼音声调在各个拼音之后,用数字 [0-4] 进行表示。如:pi1n yi1n |
pypinyin.STYLE_INITIALS | 声母风格,只返回各个拼音的声母部分。如:中国 的拼音 zh g |
pypinyin.STYLE_FINALS | 韵母风格1,只返回各个拼音的韵母部分,不带声调。如:ong uo |
pypinyin.STYLE_FINALS_TONE | 韵母风格2,带声调,声调在韵母第一个字母上。如:ōng uó |
pypinyin.STYLE_FINALS_TONE2 | 韵母风格2,带声调,声调在各个拼音之后,用数字 [0-4] 进行表示。如:o1ng uo2 |
pypinyin.STYLE_FIRST_LETTER | 首字母风格,只返回拼音的首字母部分。如:p y |
将汉字转换为拼音.
Parameters: |
|
---|---|
Returns: | 拼音列表 |
Return type: | list |
Usage:
>>> from pypinyin import pinyin
>>> import pypinyin
>>> pinyin(u'中心')
[[u'zhōng'], [u'xīn']]
>>> pinyin(u'中心', heteronym=True) # 启用多音字模式
[[u'zhōng', u'zhòng'], [u'xīn']]
>>> pinyin(u'中心', pypinyin.STYLE_INITIALS) # 设置拼音风格
[['zh'], ['x']]
修复首字母风格无法正确处理只有韵母的汉字
完善对中英文混合字符串的支持:
>> pypinyin.pinyin(u'你好abc')
[[u'n\u01d0'], [u'h\u01ceo'], [u'abc']]