AI工具

MiniMax Audio

MiniMax Audio是MiniMax推出的AI语音合成工具,能创建逼真的多语言、多声音和多情感的语音。支持文本转语音(TTS),能将文本快速转换为自然流畅的语音。用户...
阅读原文

APB

APB(Accelerating Distributed Long-Context Inference by Passing Compressed Context Blocks across GPUs)是清华大学等机构联合提出的分布式长上下文推理...
阅读原文

Botgroup.chat

Botgroup.chat 是基于 React 和 Cloudflare Pages 的多人 AI 聊天应用。支持多个 AI 角色同时参与对话,提供类似群聊的交互体验。用户可以自定义 AI 角色的性...
阅读原文

MT-MegatronLM

MT-MegatronLM 是摩尔线程推出的面向全功能 GPU 的开源混合并行训练框架,主要用于高效训练大规模语言模型。支持 dense 模型、多模态模型及 MoE(混合专家)...
阅读原文

Gemini 2.0 Flash

Gemini 2.0 Flash是Google推出的多模态AI模型,结合文本理解和图像生成能力。根据自然语言输入生成高质量的图像,支持多轮对话式的图像编辑,保持上下文连贯...
阅读原文

TokenSwift

TokenSwift 是北京通用人工智能研究院团队推出的超长文本生成加速框架,能在90分钟内生成10万Token的文本,相比传统自回归模型的近5小时,速度提升了3倍,生...
阅读原文

GradeWiz

GradeWiz 是 AI 教学助手工具,通过人工智能技术帮助教育工作者高效完成作业批改和反馈工作。能自动创建评分标准、批改学生作业,提供详细反馈,将教师的批改...
阅读原文

MIDI

MIDI(Multi-Instance Diffusion for Single Image to 3D Scene Generation)是先进的3D场景生成技术,能在短时间内将单张图像转化为高保真度的3D场景。通过...
阅读原文

Evolving Agents

Evolving Agents 是用在创建、管理和进化 AI 代理的生产级框架。Evolving Agents支持智能代理之间的通信和协作,根据语义理解需求、基于过往经验进化,有效解...
阅读原文

Open-Sora 2.0

Open-Sora 2.0 是潞晨科技推出的全新开源SOTA(State-of-the-Art)视频生成模型。Open-Sora 2.0 用 20 万美元(224 张 GPU)成功训练出 11B 参数的商业级模型...
阅读原文

Gemini Robotics

Gemini Robotics 是谷歌 DeepMind 推出的基于 Gemini 2.0 的机器人项目,将大型多模态模型的能力引入物理世界。项目包含两个主要模型:Gemini Robotics-ER 和...
阅读原文

PP-TableMagic

PP-TableMagic 是百度飞桨团队推出的高性能表格识别工具,用在将图片中的表格结构化信息提取出来,转换为 HTML 等格式,进行进一步的数据处理和分析。PP-Tabl...
阅读原文

子曰翻译2.0

子曰翻译2.0是网易有道推出的最新翻译大模型,模型在数据、算法和评估三个关键维度进行了系统性升级,实现了翻译质量、效率和鲁棒性的质的飞跃。 在数据层面...
阅读原文

理想同学网页版

理想同学网页版是理想汽车推出的网页端AI智能助手,为用户提供智能交互服务。网页版接入了DeepSeek R1&V3 671B满血版模型,问答支持切换选择 MindGPT-3o ...
阅读原文

Motion Anything

Motion Anything 是澳大利亚国立大学、悉尼大学、腾讯、麦吉尔大学、京东等机构推出的多模态运动生成框架,根据文本、音乐或两者的组合生成高质量、可控的人...
阅读原文
12425262728208