标签:多语言支持

BAG

BAG(Body-Aligned 3D Wearable Asset Generation)是香港中文大学和腾讯联合提出创新的3D可穿戴资产生成技术,通过结合多视图图像扩散模型和控制网络(Contr...
阅读原文

涌墨

涌墨是智能文档编写平台,为用户提供全流程、智能化、高质量的文档生成解决方案。通过一站式文档工作流,以项目为单位管理文档,覆盖全业务流程,帮助用户高...
阅读原文

LeetTools

LeetTools 是高效的人工智能文档工作流工具,专为提升知识工作者的效率而设计。能自动从互联网收集信息生成高质量的文档,同时支持本地知识库的构建和管理。...
阅读原文

Sa2VA

Sa2VA是字节跳动联合加州大学默塞德分校、武汉大学和北京大学共同推出的多模态大语言模型,是SAM2和LLaVA结合而成,能实现对图像和视频的密集、细粒度理解。S...
阅读原文

OpenThinker-32B

OpenThinker-32B 是斯坦福、UC 伯克利、华盛顿大学等机构联合开发的开源推理模型,拥有 328 亿参数,支持 16,000 token 的上下文长度。模型仅使用 114k 数据...
阅读原文

Magic 1-For-1

Magic 1-For-1是北京大学、Hedra Inc. 和 Nvidia 推出的高效视频生成模型,基于优化内存消耗和推理延迟快速生成高质量视频片段。模型将复杂的文本到视频生成...
阅读原文

Readdy

Readdy 是基于AI技术的产品设计工具,能将用户的想法快速转化为精美的设计稿,生成能直接使用的前端代码。用户只需用自然语言描述需求,Readdy 能在几分钟内...
阅读原文

RWKV-7-2.9B

RWKV-7-2.9B模型(RWKV-7-World-2.9B-V3) 是RWKV 基金推出的先进 RNN 大语言模型。基于 RWKV World V3 数据集训练,具有 29 亿参数,支持世界所有语言。模型...
阅读原文

Lumina-Video

Lumina-Video是上海 AI Lab 和香港中文大学推出的视频生成框架,基于Next-DiT架构,针对视频生成中的时空复杂性进行优化。基于多尺度Next-DiT架构,用不同大...
阅读原文

Zonos

Zonos是Zyphra推出的高保真文本到语音(TTS)模型。Zonos包含两个模型:16亿参数的Transformer模型和SSM混合模型,均在Apache 2.0许可下开源。Zonos根据文本...
阅读原文

potpie.ai

potpie.ai 是开源平台,基于AI技术为代码库创建定制化的工程代理(Agents)。potpie.ai基于构建代码库的知识图谱,深度理解代码组件之间的关系,实现自动化代...
阅读原文

华为小艺

华为小艺是华为推出的小艺AI助手网页端,用户可以通过浏览器直接访问使用。适配了手机和PC布局,提供多种功能,包括AI问答、AI写作、编程助手和AI翻译等。小...
阅读原文

TPO

TPO(Test-Time Preference Optimization)是新型的AI优化框架,在推理阶段对语言模型输出进行动态优化,更符合人类偏好。TPO通过将奖励信号转化为文本反馈,...
阅读原文

YAYI-Ultra

YAYI-Ultra 是中科闻歌研发的企业级大语言模型的旗舰版本,具备强大的多领域专业能力和多模态内容生成能力。支持数学、代码、金融、舆情、中医、安全等多个领...
阅读原文

HUGWBC

HUGWBC(Humanoid Unified and General Whole-Body Controller)是上海交通大学、上海AI Lab联合推出的人形机器人全身控制器,能实现精细的运动控制。HUGWBC...
阅读原文
1171819202161