AI工具

萝卜面试

萝卜面试是快手推出的为求职者提供专业AI面试辅导的在线平台。平台依托于一线互联网大厂资深导师的丰富经验,通过模拟真实面试场景,帮助求职者提升面试技巧...
阅读原文

LightOnOCR-2-1B

LightOnOCR-2-1B 是 LightOnAI 推出的高效 OCR 模型,参数量仅 1B,在复杂文档处理中表现卓越,擅长学术论文、数学公式和复杂表格的识别。
阅读原文

VibeVoice-ASR

VibeVoice-ASR 是微软开源的先进语音识别模型,专为处理长达60分钟的长音频设计。模型能一次性处理整段音频,保持全局上下文,避免传统模型分段处理导致的上...
阅读原文

Being-H0.5

Being-H0.5 是卢宗青团队推出的通用机器人模型,能通过人类先验知识和统一的动作对齐,解决机器人在不同形态硬件间的策略迁移问题。
阅读原文

Devin Review

Devin Review 是代码审查工具,支持将复杂的 GitHub 拉取请求(PR)转化为直观易懂的代码差异展示和精准的解释。通过智能算法,Devin Review能逻辑性地组织代...
阅读原文

AgentCPM-Report

AgentCPM-Report 是清华大学自然语言处理实验室、中国人民大学、面壁智能与 OpenBMB 开源社区联合推出的本地化深度调研智能体,基于8B参数的MiniCPM4.1模型。
阅读原文

Chroma 1.0

Chroma 1.0 是FlashLabs首个开源的实时端到端语音对话模型,兼具低延迟交互、高保真个性化语音克隆和强对话能力。模型通过紧密耦合语音理解与生成,采用1:2文...
阅读原文

Model1

Model1 是 DeepSeek 在 FlashMLA 代码库中更新曝光的神秘模型,可能为下一代旗舰模型 DeepSeek-V4 的内部代号或首个工程版本。
阅读原文

Step3-VL-10B

Step3-VL-10B 是阶跃星辰推出的仅含 10B 参数的开源多模态模型,在视觉感知、逻辑推理、数学竞赛和通用对话等任务中达到 200B 参数模型的性能水平。
阅读原文

EmbodiChain

EmbodiChain 是跨维智能开源的具身智能学习平台,通过生成式仿真数据推动具身智能的发展。自动创建符合物理规律的 3D 场景和任务,结合在线数据流和自我修复...
阅读原文

json-render

json-render是 Vercel 开源的项目,解决 AI 生成 UI 的不可控问题。json-render通过定义一个 Catalog,约束 AI 只能生成符合特定 Schema 的 JSON 数据,用前...
阅读原文

COTA

COTA是超参数科技推出的新型游戏智能体,基于大语言模型(LLM)驱动,具备认知、操作、战术和辅助能力。COTA突破传统强化学习与监督学习模式,通过架构创新实...
阅读原文

塔塔疗愈所

塔塔疗愈所是Soul推出的AI情绪服务小程序。应用通过塔罗占卜和趣味心理测试等功能,帮助用户更好地理解和管理自己的情绪。提供互动分享,让用户分享自己的情...
阅读原文

x-Algorithm

x-Algorithm是马斯克开源的x平台推荐算法,为“为你”信息流提供个性化内容的核心系统。结合用户关注账号的帖子(In-Network)和通过机器学习检索的全球内容(O...
阅读原文

PersonaPlex

NVIDIA PersonaPlex 是英伟达推出的全双工对话AI模型,具备同时听和说的能力,能处理自然对话中的打断、停顿和回应。用户可通过语音和文本提示自定义角色和声...
阅读原文
123303