FreeLLMAPI

FreeLLMAPI – 开源 AI 模型聚合平台，统一OpenAI兼容格式

FreeLLMAPI：汇聚海量免费AI算力，赋能开发者本地实验新纪元

在人工智能飞速发展的今天，模型调用成本往往成为制约个人开发者创新和实验的瓶颈。FreeLLMAPI应运而生，它是一款开源的OpenAI兼容代理服务，巧妙地将约14家AI服务商的免费额度整合到一个统一的API端点，每月提供高达约13亿tokens的免费推理能力。这款基于TypeScript/Express构建的代理服务，集成了自动故障转移、智能路由、密钥加密和用量追踪等强大功能，专为满足个人开发者在本地进行实验和原型验证的需求而设计。

FreeLLMAPI的核心价值在于其多功能性与便捷性：

无缝对接OpenAI生态：FreeLLMAPI提供了标准的/v1/chat/completions和/v1/models接口，这意味着您无需修改现有代码，只需调整base_url即可让官方OpenAI SDK、LangChain、LlamaIndex等主流客户端无缝接入。
海量免费额度触手可及：它整合了Google Gemini、Groq、Cerebras、SambaNova、NVIDIA NIM、Mistral、OpenRouter、GitHub Models、HuggingFace、Cohere、Cloudflare、智谱Z.ai、Moonshot Kimi、MiniMax等约14家平台的免费额度，总计每月可达13亿tokens，极大地降低了AI实验的门槛。
智能容错与高可用性：当首选的AI服务商出现请求失败（如429/5xx错误）或超时时，FreeLLMAPI会自动将其暂时禁用，并根据预设的优先级链逐一尝试其他服务商，最多可重试20次，确保了服务的连续性和稳定性。
精细化用量管理：对于每一个“平台-模型-密钥”的组合，FreeLLMAPI都能实时追踪其每分钟（RPM）、每天（RPD）、每30分钟（TPM）和每月（TPD）的请求次数和token用量，确保始终调用处于额度内的健康密钥。
稳定会话体验：为了保证多轮对话的连贯性，FreeLLMAPI会在30分钟内将对话锁定在同一个模型上，避免了模型切换可能带来的输出质量波动或上下文丢失问题。
安全加固的密钥管理：所有上游提供商的API密钥都在SQLite数据库中采用AES-256-GCM进行静态加密，仅在发起请求时临时在内存中解密，用完即焚，显著降低了密钥泄露的风险。
简化的认证机制：客户端只需使用一个统一的freellmapi-...格式的Bearer Token即可访问代理服务，无需在应用代码中硬编码多家上游的真实密钥，极大地简化了密钥管理。
全功能支持流式输出与工具调用：FreeLLMAPI完整支持Server-Sent Events（SSE）流式输出，满足长文本逐字生成的需求。同时，它也兼容OpenAI风格的tools/tool_choice多轮工具调用流程，为构建智能Agent提供了便利。
直观的可视化管理后台：内置的React/Vite管理后台提供了直观的操作界面，用户可以轻松拖拽调整回退链的优先级，在Playground中快速测试模型，并实时查看24小时、7天或30天的延迟、成功率、Token用量等统计数据。
轻量级部署，无处不在：基于TypeScript/Express构建，FreeLLMAPI的空载内存占用仅约40MB RSS，使其能够轻松部署在树莓派等ARM设备上，并通过PM2/systemd实现常驻运行，成为一个低功耗的本地AI。

使用FreeLLMAPI的过程也极为便捷：

快速安装：通过git clone克隆项目，然后执行npm install即可完成安装。
配置密钥：复制.env.example为.env文件，并生成一个32字节的ENCRYPTION_KEY用于数据加密。
启动服务：运行npm run dev即可同时启动后端API（端口3001）和管理仪表盘（端口5173）。
录入API密钥：在仪表盘的“Keys”页面，粘贴您从各个AI服务商获取的免费API密钥。
定制回退策略：在“Fallback Chain”页面，通过拖拽操作来设置您偏好的提供商优先级顺序。
获取统一访问令牌：在仪表盘上生成一个freellmapi-...格式的Bearer Token，用于客户端的身份验证。
集成到SDK：在您的应用程序中，将OpenAI客户端的base_url设置为http://localhost:3001/v1，并将模型参数设置为"auto"或具体的模型名称。
命令行测试：您也可以通过curl命令向http://localhost:3001/v1/chat/completions发送标准的OpenAI格式请求进行测试。
Playground验证：利用仪表盘内置的Playground功能，直接输入提示词即可快速验证连通性和路由效果。
后台常驻运行：借助PM2或systemd等工具，您可以轻松地将FreeLLMAPI部署为后台服务，使其在树莓派等设备上长期稳定运行。