AI项目和框架

Sonic-3

Sonic-3是Cartesia最新发布的语音AI引擎,是当前市场上速度最快、最自然的实时语音对话模型。采用创新的“状态空间模型”(SSM)架构,非传统的Transformer模型...
阅读原文

SoulX-Podcast

SoulX-Podcast 是 Soul AI Lab 推出的多说话人文本到语音(TTS)模型,专为生成长篇播客对话设计。模型参数为1.7B,支持普通话、英语及多种汉语方言(如四川...
阅读原文

GigaBrain-0

GigaBrain-0 是新型的视觉-语言-行动(VLA)基础模型,由世界模型生成的数据驱动。模型通过大规模生成多样化数据,减少了对真实机器人数据的依赖,显著提升了...
阅读原文

FlowithOS

FlowithOS是Flowith推出的全球首个智能体操作系统,使其能像人类一样与数字世界互动。FlowithOS具备浏览器、终端和脚本使用功能,能自动执行复杂任务,如文件...
阅读原文

Hailuo 2.3

Hailuo 2.3 是MiniMax推出的先进 AI 视频生成模型,基于 Hailuo 02 升级而来。模型在肢体动作、微表情、风格化表现及物理真实性方面实现显著提升,能生成更加...
阅读原文

豆包视频生成1.0 pro fast

豆包视频生成模型1.0 pro fast(Doubao-Seedance-1.0-pro-fast)是火山引擎推出的高效AI视频生成模型。模型在继承上一代核心优势的基础上,实现生成速度最高...
阅读原文

ValueCell

ValueCell 是开源的金融多智能体平台,通过 AI 技术加速金融投资研究与决策。将投研流程中的各种能力模块拆分为独立的智能体(Agent),如市场研究、数据抓取...
阅读原文

ChatGPT for any role

ChatGPT for any role是OpenAI官方推出的 ChatGPT 提示词模板,能帮助用户更高效地使用 ChatGPT 完成各种工作任务。模板覆盖从邮件撰写、会议协作到决策分析...
阅读原文

LongCat-Video

LongCat-Video是美团LongCat团队开源的136亿参数的视频生成模型,在文本到视频(Text-to-Video)、图像到视频(Image-to-Video)和视频续写(Video-Continuat...
阅读原文

MiniMax M2

MiniMax M2是MiniMax推出的专为编程和Agent工作流优化的大语言模型。模型拥有100亿激活参数和2300亿总参数,支持204,800的上下文窗口和131,072的最大输出Toke...
阅读原文

Kimi CLI

Kimi CLI 是 Moonshot AI 推出的命令行通用智能体工具,为开发者提供高效、便捷的编程辅助和文件处理功能。支持 macOS 和 Linux 系统,通过 uv 包管理器安装...
阅读原文

Nof1.ai交易提示词

Nof1.ai交易提示词是为AI交易系统设计的详细输入模板,提供全面的市场数据、技术指标和账户信息。提示词包括多个币种的当前价格、EMA、MACD、RSI等指标,及账...
阅读原文

Baichuan-M2 Plus

Baichuan-M2 Plus 是百川智能推出的循证增强医疗大模型,基于 Baichuan-M2 医疗推理模型升级而来,通过首创的六源循证推理(EAR)范式,结合 PICO 智能检索和...
阅读原文

Seed3D 1.0

Seed3D 1.0 是字节跳动 Seed 团队推出的 3D 生成大模型,能从单张图像生成高精度的 3D 模型,具有高保真资产生成、物理引擎兼容性和可扩展的场景组合能力。基...
阅读原文

混元世界模型1.1

混元世界模型1.1(HunyuanWorld-Mirror)是腾讯发布的开源3D世界生成模型。支持多视图图像、视频等多种输入方式,可输出点云、深度图、相机参数等多种3D几何...
阅读原文
12345154