用一次 AI 请求里的真实内容构成,解释上下文窗口、128K/1M token、长上下文限制、RAG 检索和实际使用中的上下文管理方法。
用聊天、长文总结、代码生成和 API 计费例子,解释 AI Token 到底是什么、为什么会影响上下文长度和使用成本。