Step3-VL-10B

Step3-VL-10B 是阶跃星辰推出的仅含 10B 参数的开源多模态模型,在视觉感知、逻辑推理、数学竞赛和通用对话等任务中达到 200B 参数模型的性能水平。
阅读原文

EmbodiChain

EmbodiChain 是跨维智能开源的具身智能学习平台,通过生成式仿真数据推动具身智能的发展。自动创建符合物理规律的 3D 场景和任务,结合在线数据流和自我修复...
阅读原文

json-render

json-render是 Vercel 开源的项目,解决 AI 生成 UI 的不可控问题。json-render通过定义一个 Catalog,约束 AI 只能生成符合特定 Schema 的 JSON 数据,用前...
阅读原文

COTA

COTA是超参数科技推出的新型游戏智能体,基于大语言模型(LLM)驱动,具备认知、操作、战术和辅助能力。COTA突破传统强化学习与监督学习模式,通过架构创新实...
阅读原文

塔塔疗愈所

塔塔疗愈所是Soul推出的AI情绪服务小程序。应用通过塔罗占卜和趣味心理测试等功能,帮助用户更好地理解和管理自己的情绪。提供互动分享,让用户分享自己的情...
阅读原文

x-Algorithm

x-Algorithm是马斯克开源的x平台推荐算法,为“为你”信息流提供个性化内容的核心系统。结合用户关注账号的帖子(In-Network)和通过机器学习检索的全球内容(O...
阅读原文

PersonaPlex

NVIDIA PersonaPlex 是英伟达推出的全双工对话AI模型,具备同时听和说的能力,能处理自然对话中的打断、停顿和回应。用户可通过语音和文本提示自定义角色和声...
阅读原文

GLM-4.7-Flash

GLM-4.7-Flash 是智谱开源、免费的混合思考模型,具有300亿参数和30亿激活参数。模型在性能与效率上达到平衡,尤其在编程、中文写作、翻译等多场景表现出色,...
阅读原文

VerseCrafter

VerseCrafter 是复旦大学与腾讯 PCG ARC Lab 等机构推出的动态真实视频世界模型,具备 4D 几何控制能力。模型基于大规模真实世界数据集 VerseControl4D 训练...
阅读原文

NovaSR

NovaSR 是开源的音频超分辨率模型,仅有 52KB 能将 16kHz 的低采样率音频(如电话音质)提升到 48kHz 的高采样率音频(如录音室级音质)。模型通过神经网络预...
阅读原文

Playwriter

Playwriter 是开源的 Chrome 插件,基于微软 Playwright 打造,专为 AI 操作浏览器设计。工具通过插件形式无缝接入 Chrome,将 AI 的能力直接嵌入用户的浏览...
阅读原文

安克AI录音豆

安克AI录音豆是飞书与安克创新合作推出的便携式 AI 录音设备。安克 AI 录音豆设计上类似一元硬币大小,带有磁力,可轻松夹在衣服或吸附在金属表面,搭配磁吸...
阅读原文

Prompt Manager

Prompt Manager (PromptX)是高效管理 AI 提示词的工具,专为提升 AI 工作效率设计。工具支持个人提示词的创建、编辑、分类和版本管理。通过智能分类和全局...
阅读原文

FrogBoss

FrogBoss 是微软研究院推出的系列编程模型。模型通过创新的复杂漏洞生成方法(BugPilot)进行训练,该方法通过让语言模型代理(LLM)在代码库中添加新功能来...
阅读原文

OpenWork

OpenWork 是开源的桌面应用程序,为知识工作者提供类似 “Claude Cowork” 风格的工作流程。OpenWork 基于 OpenCode构建,提供简洁的引导式操作界面。
阅读原文
1231,597