Pusa 是一个新颖的视频扩散模型,支持多种视频生成任务。
一个开放源代码的 14B 参数编程模型,具备高效的代码推理能力。
复旦大学发布MOSS大模型开源项目,包含核心代码和模型权重。
一个强大的文本生成模型,适用于多种对话应用。
通过强化学习驱动的金融推理大模型。
生成高质量 SVG 代码的基础模型。
百川智能开发的专为医疗场景优化的开源大语言模型,具备卓越的通用能力和医疗领域性能。
一款帮助用户整理房间的趣味提醒应用
一种通过文本迷宫解决任务来增强大型语言模型视觉推理能力的创新方法
一个从URL、YouTube视频或文本提示生成交互式思维导图的Web应用。
一款开源的14B参数量的数学模型,通过强化学习训练,性能卓越。
一个开源文本转语音系统,致力于实现人类语音的自然化。
Gen AI Toolbox for Databases 是一个开源服务器,用于简化与数据库交互的 Gen AI 工具的开发。
TableGPT2-7B 是一款专注于表格数据处理的大语言模型,适用于数据分析和商业智能任务。
NeoBase 是一款开源的 AI 数据库助手,让你用自然语言与数据库交互。
一个用于从文本和图像中提取结构化数据的代理API,基于LLMs实现。
Steiner 是一个基于合成数据训练的推理模型,旨在探索多种推理路径并自主验证。
On-device Sora 是一个基于扩散模型的移动设备端文本到视频生成项目。
FilmAgent是一个基于LLM的多智能体协作框架,用于虚拟3D空间中的端到端电影自动化制作。
EasyWeb是一个用于构建和部署与浏览器交互的AI代理的开放平台。
CocoIndex 是一个开源的数据索引引擎,支持自定义转换逻辑和增量更新。
一个开源项目,用于在浏览器中演示 AI 视频生成模型。
一种用于控制视频扩散模型运动模式的高效方法,支持运动模式的自定义和迁移。
SkyReels V1 是一个开源的人类中心视频基础模型,专注于高质量影视级视频生成。
将电子书转换为有声书的工具。
基于Kokoro和ONNX运行时的文本到语音(TTS)项目。
首个面向语境智能的人类级实时交互系统,支持多情感、多风格语音交互。
开源工业级自动语音识别模型,支持普通话、方言和英语,性能卓越。
一个用于生成对话式语音的模型,支持从文本和音频输入生成高质量的语音。
YuE是一个开源的音乐生成模型,能够将歌词转化为完整的歌曲。
一个快速启动带有OpenAI集成的Django项目的模板。
一个为LLM生成Git提交信息的插件