陈少文的网站

Nydus 懒加载镜像配置与实践

📅 2024年01月06日 · ☕ 5 分钟

据统计容器中的大部分文件不会被使用。根据这一特征，Nydus 自定义了 Rafs 格式的文件系统，实现了镜像文件的按需加载，以解决大镜像导致的启动慢和占用存储的问题。而在 AI 场景下，无论是推理还是训练，镜像常常都是几个 G 起步，甚至几十个 G，Nydus 非常

增量不再，混沌当立

📅 2024年01月01日 · ☕ 8 分钟

1. 高速前进的轮子才能保持平衡 1.1 C 端红利期已经过去截至 2023 年 6 月，我国网民规模达 10.79 亿人，较 2022 年 12 月增长 1109 万人，互联网普及率达 76.4%。C 端人口红利期已过，上网时长也增长缓慢，各类存量场景下的应用增长空间已经不大。在经历了 C 端的 easy 模式之后，很多

1. 安装驱动 1.1 查看系统是否识别显卡 1 2 3 4 lspci | grep -i vga 03:00.0 VGA compatible controller: NVIDIA Corporation GP102 [TITAN X] (rev a1) 0a:00.0 VGA compatible controller: Matrox Electronics Systems Ltd. G200eR2 (rev 01) 识别出显卡为 NVIDIA 的 TITAN X。 1.2 禁用 nouveau 1 lsmod | grep nouveau 如果有输出，说明 nouveau 已经加载，需要禁用。如果没有输出，则可以跳过此操作。 Ubuntu 系统关闭自动更新 1 sed -i.bak 's/1/0/' /etc/apt/apt.conf.d/10periodic 编辑配置

微信、公众号接入 GPT 服务

📅 2023年12月26日 · ☕ 4 分钟

提供有偿接入服务，200 RMB/年；另外，提供技术支持 200 RMB/次，不超过 1 hour；关注公众号，可获得联系方式。 1. 需要提供的信息进入 https://mp.weixin.qq.com/ 在左侧菜单栏【设置与开发】-> 【基本设置】，就能找到下面的信息 AppID 开发者 ID，可以明文直接查看到。 AppSecret

大模型应用设计与实现指南

📅 2023年12月23日 · ☕ 9 分钟

1. 直接使用大模型面临的问题输出不稳定性生成式 AI 的特点之一，输出结果的多样性。同样一个问题，问大模型多次，可能会得到不同的答案。这种输出的不确定性，在对话、创作场景下，会给用户带来惊喜。但在确定性要求比较高的场景下，大模型进入不了采纳阶段。数