AI工具

Doubao-Seed-2.0-lite

Doubao-Seed-2.0-lite 是字节跳动豆包团队推出的首款全模态理解模型。模型支持视频、图像、音频、文本的原生统一理解,同步升级了 Agent、Coding 与 GUI 能力。
阅读原文

GPT-Realtime-Translate

GPT-Realtime-Translate 是 OpenAI 推出的实时语音翻译模型,支持 70 余种输入语言实时翻译为 13 种输出语言,采用端到端架构直接处理原始音频,跳过文字中间...
阅读原文

GPT-Realtime-Whisper

GPT-Realtime-Whisper 是 OpenAI 推出的流式语音转文字模型,基于 Whisper 架构升级而来,能在用户说话的同时实时输出文字,延迟极低。
阅读原文

GPT-Realtime-2

GPT-Realtime-2 是 OpenAI 推出的第二代实时语音模型,是目前 Realtime API 中推理能力最强的语音 Agent。模型具备 GPT-5 级推理能力,能在语音对话中边听边...
阅读原文

SenseNova 6.7 Flash-Lite

SenseNova 6.7 Flash-Lite是商汤科技推出的新一代轻量化多模态智能体模型,采用原生多模态架构,专为真实世界工作流设计。
阅读原文

Grok Voice Think Fast 1.0

Grok Voice Think Fast 1.0是xAI推出的旗舰级语音智能体模型,专攻复杂多步骤真实场景。模型在τ-voice Bench排名第一,支持25种语言与全双工对话,具备低延迟...
阅读原文

AIHOT

AIHOT 是自媒体博主「数字生命卡兹克」基于 3 年 AI 自媒体经验推出的 AI 热点监控平台,通过 168 个精选信源自动抓取行业动态,经 DeepSeek 模型预筛、多维...
阅读原文

Realtime TTS-2

Realtime TTS-2 是 Inworld AI 推出的新一代实时语音合成模型,专为对话式 AI 场景打造。模型能将文本转为自然语音,更能"听懂"对话上下文的音频情...
阅读原文

JJT

JJT 是 360集团旗下 360 AI办公平台推出的 AI 生成 PPT 工具,用户只需输入主题或粘贴内容,AI 即可自动生成结构完整、视觉专业的演示文稿。核心能力覆盖智能...
阅读原文

skill-creator

skill-creator 是 Anthropic 官方推出的「元 Skill」,专为创建、迭代和优化其他 Agent Skills 设计。skill-creator通过交互式引导,将 Skill 开发的全流程——...
阅读原文

GenericAgent

GenericAgent(GA)是 A3 Lab 推出的通用自进化 LLM Agent 系统,以"上下文信息密度最大化"为核心设计原则。GenericAgent通过 9 个原子工具、30k ...
阅读原文

Models.dev

Models.dev 是 OpenCode 团队开源的 AI 模型数据库。Models.dev 以标准化 TOML 格式整合 OpenAI、Anthropic、Google 等数十家主流厂商的模型信息,涵盖价格、...
阅读原文

DeepSeek-TUI

DeepSeek-TUI 是完全运行在终端中的编程智能体,由 Hayden Brown 基于 Rust 构建,专为 DeepSeek V4 系列模型(deepseek-v4-pro / deepseek-v4-flash)原生设...
阅读原文

GPT-5.5 Instant

GPT-5.5 Instant是OpenAI发布的ChatGPT新一代默认模型,取代GPT-5.3 Instant,免费向所有用户开放。模型融合5.5的基础智力与极速响应,高风险领域幻觉减少52....
阅读原文

OpenWhip

OpenWhip 是基于 Electron 的开源桌面小工具,专为 Claude Code 用户设计。当 AI 陷入死循环、反复修改同一行代码或长时间无响应时,用户点击托盘鞭子图标,...
阅读原文
12345333