Star Office UI
Star Office UI 是开源的像素风格的 AI 可视化状态看板,支持将 AI 助手的工作状态实时可视化。Star Office UI 支持 6 种状态映射到不同办公区域,配备昨日工...
商汤输入法AudioClaw
商汤输入法AudioClaw是商汤科技基于日日新多模态大模型推出的智能语音输入工具。工具集语音转文字、智能润色、即时翻译、口语净化、AI会议助手于一体,支持毫...
SenseAudio
SenseAudio 是商汤科技推出的 AI 语音开放平台,主打"自然好听、富有情绪的 AI 语音"。平台集成 70+ 精品音色,提供文本转语音、声音克隆(3秒素材...
FeelFish 3.0 发布
当 AI 还在以「单智能体问答」的方式帮你改一句台词时,FeelFish 已经在思考一个更宏大的问题:如果每一个创作环节都有一位专属的 AI 专家坐镇,写作会变成什...
Voxtral TTS
Voxtral TTS 是 Mistral AI开源的文本转语音模型,基于 40 亿参数架构,支持 9 种语言。模型具备 90 毫秒超低延迟和 6 倍实时生成速度,仅需 3-5 秒音频可实...
Gemini 3.1 Flash Live
Gemini 3.1 Flash Live是Google最新推出的高质量实时语音模型,专为自然流畅的对话交互设计。模型在语调理解、推理能力和响应速度上均有显著提升,能精准识别...
daVinci-MagiHuman
daVinci-MagiHuman 是上海创智学院 GAIR 实验室与 Sand.ai 联合开源的音视频联合生成基座模型。模型采用 150 亿参数的单流 Transformer 架构,统一建模文本、...
LongCat-Next
LongCat-Next是美团LongCat推出的多模态模型,核心创新是LoZA稀疏注意力机制。模型通过智能筛查模块重要性,将50%低重要模块替换为流式稀疏注意力,形成全局...
TurboQuant
TurboQuant 是 Google Research 推出的向量量化算法,可将大模型 KV Cache 从 32-bit 压缩至 3-bit,实现内存降低 6 倍、推理速度提升 8 倍,且精度零损失。
粤公网安备 44011502001135号