RSS
TAG
Podcast
关于我们/aboutus
广告合作/ad
帮助我们/contribute
帐号
自动登录
找回密码
密码
登录
骑士注册
Linux 中国
技术
新闻
观点
分享
LCTT
桌面应用
系统运维
软件开发
树莓派
容器与云
区块链
硬核观察
极客漫画
开源智慧
穿山甲专访
开源之道
代码英雄
Linux 发行版
搜索
搜索
❏ 站外平台:
暗黑模式
文本模式
文章
Linux 中国◆开源社区
›
首页
›
查看评论
使用 awk 统计字母频率
评论 (2)
|
发表评论
来自四川的 Chrome 85.0|Windows 10 用户
2022-03-20 15:19
6
赞
回复
如果只统计字母个数。在 /usr/share/dict/words 文件的所有小写单词中,字母 j, q, x 出现的个数最低,字母 z 个数也很少。不出意料,字母 e 是个数最高的。
$ grep '^[a-z]*$' /usr/share/dict/words | sed 's/\(.\)/\1\n/g' | sed '/^$/d' | sort -n | uniq -c | sort -n
> 1176 j
> 1211 q
> 1886 x
> 2779 z
> ……
> 56807 i
> 58913 s
> 76103 e
来自四川的 Chrome 85.0|Windows 10 用户
2022-03-20 14:58
8
赞
回复
"Linux 系统在 /usr/share/dict/words 文件中提供了一个单词列表",这个 words 文件中的单词数据来自 Moby 项目 (icon.shef.ac.uk/Moby),常用于拼写检查程序。
- Debian 系,由 wamerican 软件包提供 words 文件。
- Fedora,由 words 软件包提供 words 文件。
- Arch Linux,由 words 软件包提供,但是个软链接。
回复
的评论:
评论
返回顶部
分享到微信
打开微信,点击顶部的“╋”,
使用“扫一扫”将网页分享至微信。