关于 IPv6 地址分配的一切

序言 IPv4 只有一种动态地址分配方式,即 DHCP,但 IPv6 就有 SLAAC 和 DHCPv6 两种分配方式,同时 DHCPv6 还存在 PD (Prefix Delegation) 的扩展。这三种分配方式之间又存在交互,使得 IPv6 分配过程中出现的问题远比 IPv4 多。大多数可以搜到的教程只从表面解决了问题,对于其后的技术细节模棱两可,而没有从根本上厘清 IPv6 与 IPv4 的差异, ...

2024-10-12 · 7 分钟 · Monsoon

NFS Performance Tuning

前言 本文是我在实践中总结出的生产场景下 10 Gbps 网络下的 NFS 性能调优指南,特别是针对大量小文件(Lots of Small Files, LOSF)读写的优化。 调优 硬件 网络硬件方面,带宽和延迟两者都很重要。 ...

2024-02-16 · 4 分钟 · Monsoon

Building WireGuard VPN for Machine Learning Server Cluster

Motivation 机器学习集群需要一个安全的方式向用户暴露服务,以及跨公网服务器互联,为此需要部署 VPN 网络。 VPN 网络的部署需要考虑如下因素: 网络拓扑:需要选择合适的拓扑结构以尽可能降低延迟; 用户管理:可以方便地进行用户的增减和授权; 使用和维护简单。 Design 网络拓扑 网络拓扑决定着延迟。 ...

2024-01-29 · 2 分钟 · Monsoon

Ascend 910B 自定义 PyTorch 算子

环境 本文基于的硬件环境为 Ascend 910B3,基于的软件环境包括 CANN 7.0-RC1、PyTorch 1.11.0、Ascend PyTorch Adapter v5.0.rc3-pytorch1.11.0。其他 CANN 和 PyTorch 版本上的情况可能略有不同。 ...

2023-11-14 · 2 分钟 · Monsoon

我的 TOEFL 经验

前言 作为高考以来带给我最大焦虑感的考试,TOEFL 让我 2023 年大部分时间在黑暗中度过,我对其的时间、金钱投入也是最大的。 一开始定下总分 100、口语 20 的目标,中间经历了无数天自信心丧失、被焦虑情绪淹没、口语练到舌头打结,最终在 2023 年 11 月 3 日查询到了满意的成绩。 ...

2023-11-05 · 8 分钟 · Monsoon

利用 SSH 反向隧道登录 BitaHub 中的容器并长期占用 GPU

问题 每年的 CVPR 前 GPU 总是供不应求,需要从其他地方借卡。USTC 有一个供校内用户使用的 BitaHub,但它同样有 CVPR 前一卡难求的问题,同时基于任务提交的使用模式也非常不方便,提交占用多卡的任务经常需要漫长的排队,数据管理方式更是反人类。 ...

2023-10-20 · 2 分钟 · Monsoon

Nginx 启用 QUIC 并和 SNI 分流共存

问题 Nginx 自从 1.25.0 版本以来对 QUIC 的支持已被合并入 mainline,对于想体验的用户而言可以直接使用官方发布的 nginx docker 镜像,非常方便。 但是我的服务器上的 nginx 使用了 SNI 分流,源于 Shadow TLS 和 Xray Reality 等新一代基于 TLS 的代理协议的需求。这些代理协议并不能由 nginx 代为处理 TLS 层(和之前可以使用 gPRC/WebSocket 等作为数据传输方式的协议不同),但为了实现最好的伪装效果,使用 443/tcp 端口是有必要的(伪装的白名单目标网站一般情况下也只会在 443/tcp 端口开放 HTTPS 服务)。因此 443/tcp 端口的复用是必要的。 ...

2023-09-26 · 2 分钟 · Monsoon

优化 MKL 在 AMD CPU 上的性能

问题 实验室有一些 AMD EPYC 7713 的服务器,采购的原因是组里有一些人的程序有非常高的 CPU 负载(我也不知道是什么负载,为什么不能跑在 GPU 上,我也没有精力去逐个帮助解决),框框多的 AMD 处理器非常适合这种需求。 ...

2023-06-19 · 2 分钟 · Monsoon