AI
Headroom:让 AI 编程助手更省 Token
· ☕ 8 分钟
1. Headroom 是什么 Headroom 是一款面向 AI Agent 的上下文压缩层。它在 LLM 收到请求之前,对工具输出、日志、RAG 片段、文件内容和对话历史做内容感知压缩,把 token 用量压到原来的 5%~40%,同时尽量保持回答质量不变。 简单说,它解决的是另一头的问题:CodeGraph 帮 agent 更

Claude Code 自定义模型配置与使用技巧
· ☕ 3 分钟
参考:Claude Code 配置、环境变量、接入 LLM 网关 Claude Code 走 Anthropic Messages API。接自定义网关时,用 settings.json 的 env 块覆盖 endpoint 和模型。 1. 配置文件在哪 用户配置默认在 ~/.claude/settings.json(Windows 为 %USERPROFILE%\.claude\

Codex 自定义模型配置与使用技巧
· ☕ 3 分钟
参考:Codex 配置基础、Codex 高级配置 Codex 走 OpenAI Responses API。接自定义网关时,用 [model_providers.<id>] 定义 endpoint,顶层 model 和 model_provider 决定实际调用。 1. 配置文件在哪 用户配置默认在 ~/.codex/config.toml(Windows 为 %USERPROFILE%\

OpenCode 自定义模型配置与使用技巧
· ☕ 2 分钟
参考:OpenCode Config、Providers OpenCode 走 OpenAI Chat Completions API。接自定义网关时,在 opencode.jsonc 的 provider 块声明 endpoint 和模型列表。 1. 安装与配置文件 1 npm install -g opencode-ai 用户配置默认在 ~/.config/opencode/opencode.jsonc(也可用 openc

LiteLLM - 提供统一的模型接口格式
· ☕ 4 分钟
1. LiteLLM 是什么 LiteLLM 是开源 LLM 适配器:用 OpenAI 标准格式调用 100+ 种 API(OpenAI、Anthropic、Gemini、Bedrock、Azure、Ollama、vLLM、通义千问等)。 两种用法: Python SDK — 代码内直接调用 AI Gateway — 团队级代理,带鉴权、计费、负载均衡