CPU

从 CPU 到网络记录一次排查应用慢的过程

📅 2023年11月08日 · ☕ 7 分钟

1. 现象业务反馈应用 app-a 的接口慢，查看日志发现是某一个 Pod 慢，删除该 Pod 让其更换节点就好。从监控指标可以看到，Pod 的 CPU 使用率确实有剧增。但该 Pod 没有达到 Limit 的限制，没有被限流 CPU。接着看节点的 CPU 监控，发现节点的 CPU 使用率也有剧增。并且增加的部分是 System C

1. 本地容器运行启动 LLM 1 docker run --rm -p 8000:8000 shaowenchen/chinese-alpaca-2-7b-gguf:Q2_K 在 http://localhost:8000/docs 页面即可看到接口文档，如下图: 部署一个简单的 Chat UI 这里需要注意的是 OPENAI_API_HOST 参数，需要设置为你的宿主机 IP 地址，而不是 localhost 127.0.0.1，否则无法访问。 1 docker run -e OPENAI_API_HOST=http://{YOUR_HOST_IP}:8000 -e OPENAI_API_KEY=random -p 3000:3000 hubimage/chatbot-ui:main 页面效果如下: 2. K8s 快速部署部署 LLM 应用 kubectl create

从 CPU 到网络记录一次排查应用慢的过程

📅 2023年11月08日 · ☕ 7 分钟

使用 CPU 推理 llama 结构的大模型

📅 2023年09月16日 · ☕ 4 分钟