AI项目和框架

Kimi Linear

Kimi Linear 是月之暗面推出的新型混合线性注意力架构,专为提升大型语言模型(LLMs)在长序列任务中的效率和性能设计。核心组件 Kimi Delta Attention(KDA...
阅读原文

Music 2.0

Music 2.0 是MiniMax最新推出的先进音乐创作模型。模型能精准捕捉和还原人声的细腻情绪与器乐的动态张力,支持多种唱法和风格切换,如流行、爵士、摇滚等,还...
阅读原文

Firefly Image 5

Firefly Image 5 是 Adobe 发布的最新图像生成模型。具备原生400万像素输出能力,能直接生成高分辨率图像,细节表现力大幅提升。在人物渲染方面,新模型优化...
阅读原文

Speech 2.6

Speech 2.6 是MiniMax推出的全新语音生成模型,专为新一代语音智能体设计,具备超低延时(低于250毫秒),确保实时对话流畅;支持多种语言的网址、邮箱、电话...
阅读原文

FIBO

FIBO 是首个开源的、原生支持 JSON 的文本生成图像模型,专为长结构化描述训练而成。模型在超过 1 亿条结构化 JSON 描述(每条约 1,000 字)上训练,能精确、...
阅读原文

Sonic-3

Sonic-3是Cartesia最新发布的语音AI引擎,是当前市场上速度最快、最自然的实时语音对话模型。采用创新的“状态空间模型”(SSM)架构,非传统的Transformer模型...
阅读原文

SoulX-Podcast

SoulX-Podcast 是 Soul AI Lab 推出的多说话人文本到语音(TTS)模型,专为生成长篇播客对话设计。模型参数为1.7B,支持普通话、英语及多种汉语方言(如四川...
阅读原文

GigaBrain-0

GigaBrain-0 是新型的视觉-语言-行动(VLA)基础模型,由世界模型生成的数据驱动。模型通过大规模生成多样化数据,减少了对真实机器人数据的依赖,显著提升了...
阅读原文

FlowithOS

FlowithOS是Flowith推出的全球首个智能体操作系统,使其能像人类一样与数字世界互动。FlowithOS具备浏览器、终端和脚本使用功能,能自动执行复杂任务,如文件...
阅读原文

Hailuo 2.3

Hailuo 2.3 是MiniMax推出的先进 AI 视频生成模型,基于 Hailuo 02 升级而来。模型在肢体动作、微表情、风格化表现及物理真实性方面实现显著提升,能生成更加...
阅读原文

豆包视频生成1.0 pro fast

豆包视频生成模型1.0 pro fast(Doubao-Seedance-1.0-pro-fast)是火山引擎推出的高效AI视频生成模型。模型在继承上一代核心优势的基础上,实现生成速度最高...
阅读原文

ValueCell

ValueCell 是开源的金融多智能体平台,通过 AI 技术加速金融投资研究与决策。将投研流程中的各种能力模块拆分为独立的智能体(Agent),如市场研究、数据抓取...
阅读原文

ChatGPT for any role

ChatGPT for any role是OpenAI官方推出的 ChatGPT 提示词模板,能帮助用户更高效地使用 ChatGPT 完成各种工作任务。模板覆盖从邮件撰写、会议协作到决策分析...
阅读原文

LongCat-Video

LongCat-Video是美团LongCat团队开源的136亿参数的视频生成模型,在文本到视频(Text-to-Video)、图像到视频(Image-to-Video)和视频续写(Video-Continuat...
阅读原文

MiniMax M2

MiniMax M2是MiniMax推出的专为编程和Agent工作流优化的大语言模型。模型拥有100亿激活参数和2300亿总参数,支持204,800的上下文窗口和131,072的最大输出Toke...
阅读原文
145678157