全国服务热线
服务热线
当前位置: 首页 >
【更新】对不起大家qwq之前的正则表达式提取汉字和删人名的部分有点问题!!!现在已经修复过来了!!!口语语料库总有效字数10***62字!中国人说的“是”字最多。
不是“的”也不是“了”。
“的”仅仅排第三,“了”字甚至没有进前十。
这个问题不能直接照搬现有的字频数据啦。
既然题主问的是“中国人 说哪个字最多”,那么我们不能统计书面语语料,必须统计口语语料,甚至使用聊天记录都会有一定的偏差,因为我们打下的字不一定…。
华为 HDC 发布 HarmonyOS 6 开发者 beta 版对应用开发者和鸿蒙生态有哪些影响?
北京语言大学张爱玲教授被清华树木砸中逝世,清华回应系绿化养护人员违规作业所致,事故责任该如何划分?
PHP初学者,我能不能使用PHP来开发桌面应用?
怎么提高latex编译速度?
Linux 内核的系统有没有类似macOS 那样漂亮流畅的桌面环境的发行版本?
为什么百度搜索引擎越做越差?
字节大量使用新语言,包括go,rust等,为什么阿里一直都抱着j***a不松手?
蜂鸟音乐指控邓紫棋侵权,要求 48 小时内下架重录歌曲,邓紫棋回应「不会下架」,这一指控合理吗?
QQ咨询
联系电话
微信扫一扫
返回顶部