<?xml version="1.0" encoding="utf-8" standalone="yes"?><rss version="2.0" xmlns:atom="http://www.w3.org/2005/Atom"><channel><title>Monsoon's Blog</title><link>https://monsoon-cs.moe/zh/tags/slaac/</link><description>Recent content on Monsoon's Blog</description><generator>Hugo</generator><language>zh</language><lastBuildDate>Sat, 12 Oct 2024 00:00:00 +0000</lastBuildDate><item><title>关于 IPv6 地址分配的一切</title><link>https://monsoon-cs.moe/zh/2024-10-12-all-about-ipv6-addr-alloc/</link><pubDate>Sat, 12 Oct 2024 00:00:00 +0000</pubDate><guid>https://monsoon-cs.moe/zh/2024-10-12-all-about-ipv6-addr-alloc/</guid><description>&lt;h2 id="序言"&gt;序言&lt;/h2&gt;
&lt;p&gt;IPv4 只有一种动态地址分配方式，即 DHCP，但 IPv6 就有 SLAAC 和 DHCPv6 两种分配方式，同时 DHCPv6 还存在 PD (Prefix Delegation) 的扩展。这三种分配方式之间又存在交互，使得 IPv6 分配过程中出现的问题远比 IPv4 多。大多数可以搜到的教程只从表面解决了问题，对于其后的技术细节模棱两可，而没有从根本上厘清 IPv6 与 IPv4 的差异，&lt;/p&gt;</description></item><item><title>NFS Performance Tuning</title><link>https://monsoon-cs.moe/zh/2024-02-16-nfs-tuning/</link><pubDate>Fri, 16 Feb 2024 00:00:00 +0000</pubDate><guid>https://monsoon-cs.moe/zh/2024-02-16-nfs-tuning/</guid><description>&lt;h2 id="前言"&gt;前言&lt;/h2&gt;
&lt;p&gt;本文是我在实践中总结出的生产场景下 10 Gbps 网络下的 NFS 性能调优指南，特别是针对&lt;strong&gt;大量小文件&lt;/strong&gt;（Lots of Small Files, LOSF）读写的优化。&lt;/p&gt;
&lt;h2 id="调优"&gt;调优&lt;/h2&gt;
&lt;h3 id="硬件"&gt;硬件&lt;/h3&gt;
&lt;p&gt;网络硬件方面，&lt;strong&gt;带宽&lt;/strong&gt;和&lt;strong&gt;延迟&lt;/strong&gt;两者都很重要。&lt;/p&gt;</description></item><item><title>Building WireGuard VPN for Machine Learning Server Cluster</title><link>https://monsoon-cs.moe/zh/2024-01-29-wg-for-cluster/</link><pubDate>Mon, 29 Jan 2024 00:00:00 +0000</pubDate><guid>https://monsoon-cs.moe/zh/2024-01-29-wg-for-cluster/</guid><description>&lt;h2 id="motivation"&gt;Motivation&lt;/h2&gt;
&lt;p&gt;机器学习集群需要一个安全的方式向用户暴露服务，以及跨公网服务器互联，为此需要部署 VPN 网络。&lt;/p&gt;
&lt;p&gt;VPN 网络的部署需要考虑如下因素：&lt;/p&gt;
&lt;ol&gt;
&lt;li&gt;网络拓扑：需要选择合适的拓扑结构以尽可能降低延迟；&lt;/li&gt;
&lt;li&gt;用户管理：可以方便地进行用户的增减和授权；&lt;/li&gt;
&lt;li&gt;使用和维护简单。&lt;/li&gt;
&lt;/ol&gt;
&lt;h2 id="design"&gt;Design&lt;/h2&gt;
&lt;h3 id="网络拓扑"&gt;网络拓扑&lt;/h3&gt;
&lt;p&gt;网络拓扑决定着延迟。&lt;/p&gt;</description></item><item><title>Ascend 910B 自定义 PyTorch 算子</title><link>https://monsoon-cs.moe/zh/2023-11-14-ascend-910b-custom-op/</link><pubDate>Tue, 14 Nov 2023 00:00:00 +0000</pubDate><guid>https://monsoon-cs.moe/zh/2023-11-14-ascend-910b-custom-op/</guid><description>&lt;h2 id="环境"&gt;环境&lt;/h2&gt;
&lt;p&gt;本文基于的硬件环境为 Ascend 910B3，基于的软件环境包括 &lt;a href="https://www.hiascend.com/developer/download/community/result"&gt;CANN 7.0-RC1&lt;/a&gt;、&lt;a href="https://repo.huaweicloud.com/kunpeng/archive/Ascend/PyTorch/"&gt;PyTorch 1.11.0&lt;/a&gt;、&lt;a href="https://gitee.com/ascend/pytorch/releases/tag/v5.0.rc3-pytorch1.11.0"&gt;Ascend PyTorch Adapter v5.0.rc3-pytorch1.11.0&lt;/a&gt;。其他 CANN 和 PyTorch 版本上的情况可能略有不同。&lt;/p&gt;</description></item><item><title>我的 TOEFL 经验</title><link>https://monsoon-cs.moe/zh/2023-11-05-toefl-exp/</link><pubDate>Sun, 05 Nov 2023 00:00:00 +0000</pubDate><guid>https://monsoon-cs.moe/zh/2023-11-05-toefl-exp/</guid><description>&lt;h2 id="前言"&gt;前言&lt;/h2&gt;
&lt;p&gt;作为高考以来带给我最大焦虑感的考试，TOEFL 让我 2023 年大部分时间在黑暗中度过，我对其的时间、金钱投入也是最大的。&lt;/p&gt;
&lt;p&gt;一开始定下总分 100、口语 20 的目标，中间经历了无数天自信心丧失、被焦虑情绪淹没、口语练到舌头打结，最终在 2023 年 11 月 3 日查询到了满意的成绩。&lt;/p&gt;</description></item><item><title>利用 SSH 反向隧道登录 BitaHub 中的容器并长期占用 GPU</title><link>https://monsoon-cs.moe/zh/2023-10-20-bitahub/</link><pubDate>Fri, 20 Oct 2023 00:00:00 +0000</pubDate><guid>https://monsoon-cs.moe/zh/2023-10-20-bitahub/</guid><description>&lt;h2 id="问题"&gt;问题&lt;/h2&gt;
&lt;p&gt;每年的 CVPR 前 GPU 总是供不应求，需要从其他地方借卡。USTC 有一个供校内用户使用的 &lt;a href="https://bitahub.ustc.edu.cn/"&gt;BitaHub&lt;/a&gt;，但它同样有 CVPR 前一卡难求的问题，同时基于任务提交的使用模式也非常不方便，提交占用多卡的任务经常需要漫长的排队，数据管理方式更是反人类。&lt;/p&gt;</description></item><item><title>Nginx 启用 QUIC 并和 SNI 分流共存</title><link>https://monsoon-cs.moe/zh/2023-09-26-nginx-quic-with-ssl-preread/</link><pubDate>Tue, 26 Sep 2023 00:00:00 +0000</pubDate><guid>https://monsoon-cs.moe/zh/2023-09-26-nginx-quic-with-ssl-preread/</guid><description>&lt;h2 id="问题"&gt;问题&lt;/h2&gt;
&lt;p&gt;Nginx 自从 1.25.0 版本以来对 QUIC 的支持&lt;a href="https://nginx.org/en/docs/quic.html"&gt;已被合并入 mainline&lt;/a&gt;，对于想体验的用户而言可以直接使用官方发布的 &lt;code&gt;nginx&lt;/code&gt; docker 镜像，非常方便。&lt;/p&gt;
&lt;p&gt;但是我的服务器上的 nginx 使用了 &lt;a href="https://nginx.org/en/docs/stream/ngx_stream_ssl_preread_module.html"&gt;SNI 分流&lt;/a&gt;，源于 &lt;a href="https://github.com/ihciah/shadow-tls"&gt;Shadow TLS&lt;/a&gt; 和 &lt;a href="https://github.com/XTLS/REALITY"&gt;Xray Reality&lt;/a&gt; 等新一代基于 TLS 的代理协议的需求。这些代理协议并不能由 nginx 代为处理 TLS 层（和之前可以使用 gPRC/WebSocket 等作为数据传输方式的协议不同），但为了实现最好的伪装效果，使用 &lt;code&gt;443/tcp&lt;/code&gt; 端口是有必要的（伪装的白名单目标网站一般情况下也只会在 &lt;code&gt;443/tcp&lt;/code&gt; 端口开放 HTTPS 服务）。因此 &lt;code&gt;443/tcp&lt;/code&gt; 端口的复用是必要的。&lt;/p&gt;</description></item><item><title>优化 MKL 在 AMD CPU 上的性能</title><link>https://monsoon-cs.moe/zh/2023-06-19-mkl-on-amd/</link><pubDate>Mon, 19 Jun 2023 00:00:00 +0000</pubDate><guid>https://monsoon-cs.moe/zh/2023-06-19-mkl-on-amd/</guid><description>&lt;h2 id="问题"&gt;问题&lt;/h2&gt;
&lt;p&gt;实验室有一些 AMD EPYC 7713 的服务器，采购的原因是组里有一些人的程序有非常高的 CPU 负载（我也不知道是什么负载，为什么不能跑在 GPU 上，我也没有精力去逐个帮助解决），框框多的 AMD 处理器非常适合这种需求。&lt;/p&gt;</description></item></channel></rss>