硬核观察 #556 微软的星球级的 AI 基础设施包括数十万个 GPU

2022-02-23 21:10


微软的星球级的 AI 基础设施包括数十万个 GPU

微软透露,它运营着一个星球级的分布式调度服务来处理 AI 工作负载,它被称为“奇点”。它的目的是提高深度学习工作负载的高利用率来控制成本。其工作负载感知调度器可以透明地抢占和弹性地扩展深度学习工作负载,在 AI 加速器(如 GPU、FPGA)全球机群上提高利用率,而不影响其正确性或性能。在“奇点”机群中有数十万个 GPU,以及 FPGA 和其他 AI 加速器。该软件自动将工作与加速器资源解耦,这意味着当工作负载扩大或缩小时,只需改变映射的设备数量,而这对用户来说是完全透明的。

老王点评:首先我吃惊于其规模,其次,我觉得超算之外的集群技术非常有用。

Fedora 考虑默认为 cURL提供精简版本

cURL 是一个广泛使用的网络客户端,除了 HTTP(S) 之外,它还可以访问诸多网络协议,此外大量的应用使用 libcurl 来访问网络资源。在近日提交的一份针对 Fedora 37 的 修改建议 中,推荐默认使用精简版的 cURL 包,只提供了 HTTP/HTTPS/FTP 支持,而那些需要其他网络协议支持的用户可以安装完整包。精简包禁用了大量过时或很少使用的协议,如 GOPHER、IMAP、LDAP、MQTT、NTLM、POP3、RTSP、SMB、SMTP、SFTP、TELNET、TFTP 等等,这些协议有时候会带来安全风险。

老王点评:确实,很多历史遗留或很少使用的网络协议,如果没有明确需要的话,留着只是增加攻击面。其它传统的工具也应该学习这种改变的思路。

内核开发者正在讨论弃用 ReiserFS 文件系统

在 21 年前,ReiserFS 作为 Linux 内核的首个日志文件系统被引入。在推出的早期,这一开源文件系统提供了相当多的创新功能,甚至一度被 SuSE Linux 默认使用。然而自从 ReiserFS 主要开发者 Hans Reiser 在 15 年前因杀妻而入狱后,ReiserFS / Reiser4 已停滞相当长一段时间。至少自 2019 年以来,似乎就没有任何用户上报的 ReiserFS bug 被修复。在被 EXT4、XFS、Btrfs、甚至 OpenZFS 吸引走了越来越多的份额之后,内核开发者发起了“是否要将 ReiserFS 踢出 Linux 内核支持”的讨论。

老王点评:正所谓人亡政息,但是还是很可惜。