汉语拼音方案中的声母问题及注意事项

▌一些注意事项

1.为什么没有 y, w, yu 几个声母？

1>>> from pypinyin import Style, pinyin
2>>> pinyin('下雨天', style=Style.INITIALS)
3[['x'], [''], ['t']]

因为根据《汉语拼音方案》， y，w，ü (yu) 都不是声母。

声母风格（INITIALS）下，“雨”、“我”、“圆”等汉字返回空字符串，因为根据《汉语拼音方案》， y，w，ü (yu) 都不是声母，在某些特定韵母无声母时，才加上 y 或 w，而 ü 也有其特定规则。 —— @hotoo

如果你觉得这个给你带来了麻烦，那么也请小心一些无声母的汉字（如“啊”、“饿”、“按”、“昂”等）。这时候你也许需要的是首字母风格（FIRST_LETTER）。 —— @hotoo

参考:

hotoo/pinyin#57,#22,#27,#44

如果觉得这个行为不是你想要的，就是想把 y 当成声母的话，可以指定strict=False，这个可能会符合你的预期，详见strict 参数的影响

1>>> from pypinyin import Style, pinyin
2>>> pinyin('下雨天', style=Style.INITIALS)
3[['x'], [''], ['t']]
4>>> pinyin('下雨天', style=Style.INITIALS, strict=False)
5[['x'], ['y'], ['t']]


2.拼音数据
3.node 版和 web 版有什么异同？
pinyin目前可以同时运行在 Node 服务器端和 Web 浏览器端。 API 和使用方式完成一致。但 Web 版较 Node 版稍简单，拼音库只有常用字部分，没有使用分词算法， 并且考虑了网络传输对词库进行了压缩处理。
由于分词和繁体中文的特性，部分情况下的结果也不尽相同。由于这些区别，测试不同运行环境的用例也不尽相同。
特性
Web 版
Node 版
拼音库
常用字库。压缩、合并
完整字库。不压缩、合并
分词
没有分词

使用分词算法，多音字拼音更准确。
拼音频度排序
有根据拼音使用频度优先级排序。
同 Web 版。
繁体中文
没有繁体中文支持。
有简单的繁简汉字转换。
更多详细安装与使用教程可访问 GitHub 链接进行访问~
各版本 GitHub 地址：
新华字典 API
▌介绍

作者本来的目的是想可以实现成语接龙，苦于没有现成可用的数据库，自己就从各个网站抓取整理了一份。所有的数据都作者从网上找的。放在 Github 是为了方便自己的使用，同时也能方便有类似需求的人不用去做这些 trival 的工作。所有抓取数据的脚本都在仓库里。
中华新华字典数据库和 API 。收录包括 14032 条歇后语，16142 个汉字，264434 个词语，31648 个成语。所有的数据放在 data/ 目录。
▌数据库与 API 介绍
1.成语（idiom.json)
2.词语（ci.json）
3.汉字（word.json)
4.歇后语（xiehouyu.json)
使用可访问 GitHub 地址：

———END———
限 时 特 惠： 本站每日持续更新海量各大最新【内部创业教程】，一年会员只需 98 元，全站资源免费下载 点击查看详情
站 长 微 信： webprojs_com

声明：本站所有文章，如无特殊说明或标注，均为本站原创发布。任何个人或组织，在未征得本站同意时，禁止复制、盗用、采集、发布本站内容到任何网站、书籍等各类媒体平台。如若本站内容侵犯了原著者的合法权益，可联系我们进行处理。
分词声母汉语拼音方案注意事项繁体中文

	
		
            
                            
                    admin永久会员

相关文章

发表回复 取消回复

发表回复取消回复