AI工具

FlowAct-R1

FlowAct-R1是字节跳动推出的实时交互数字人视频生成框架,仅需单张参考图和音频,支持流式生成无限时长的全身动态视频。
阅读原文

Dokie

Dokie 是 AI PPT 生成工具,能根据用户输入的主题、文档或链接快速生成演示文稿。工具以内容为中心,自动适配布局与设计,每一页都精准表达用户意图。
阅读原文

Agentation

Agentation 是开源的AI编程协作工具,能解决开发者与 AI 编程助手之间沟通效率低下的问题。工具通过让用户直接在网页上标注问题,将视觉反馈转化为代码可读的...
阅读原文

YouNews

YouNews是一款帮助用户主动追踪信息的 AI工具。用户可以通过描述专题的方式,让系统自动持续追踪并整理和解读相关的信息,从而实现从「被动接收信息」到「系...
阅读原文

AI学习搭子

AI学习搭子是智谱清言推出的智能学习辅助工具,专为提升学习效率和质量设计。工具通过AI技术将学习资料转化为易于消化的知识结构,简化复杂概念。AI学习搭子...
阅读原文

萝卜面试

萝卜面试是快手推出的为求职者提供专业AI面试辅导的在线平台。平台依托于一线互联网大厂资深导师的丰富经验,通过模拟真实面试场景,帮助求职者提升面试技巧...
阅读原文

LightOnOCR-2-1B

LightOnOCR-2-1B 是 LightOnAI 推出的高效 OCR 模型,参数量仅 1B,在复杂文档处理中表现卓越,擅长学术论文、数学公式和复杂表格的识别。
阅读原文

VibeVoice-ASR

VibeVoice-ASR 是微软开源的先进语音识别模型,专为处理长达60分钟的长音频设计。模型能一次性处理整段音频,保持全局上下文,避免传统模型分段处理导致的上...
阅读原文

Being-H0.5

Being-H0.5 是卢宗青团队推出的通用机器人模型,能通过人类先验知识和统一的动作对齐,解决机器人在不同形态硬件间的策略迁移问题。
阅读原文

Devin Review

Devin Review 是代码审查工具,支持将复杂的 GitHub 拉取请求(PR)转化为直观易懂的代码差异展示和精准的解释。通过智能算法,Devin Review能逻辑性地组织代...
阅读原文

AgentCPM-Report

AgentCPM-Report 是清华大学自然语言处理实验室、中国人民大学、面壁智能与 OpenBMB 开源社区联合推出的本地化深度调研智能体,基于8B参数的MiniCPM4.1模型。
阅读原文

Chroma 1.0

Chroma 1.0 是FlashLabs首个开源的实时端到端语音对话模型,兼具低延迟交互、高保真个性化语音克隆和强对话能力。模型通过紧密耦合语音理解与生成,采用1:2文...
阅读原文

Model1

Model1 是 DeepSeek 在 FlashMLA 代码库中更新曝光的神秘模型,可能为下一代旗舰模型 DeepSeek-V4 的内部代号或首个工程版本。
阅读原文

Step3-VL-10B

Step3-VL-10B 是阶跃星辰推出的仅含 10B 参数的开源多模态模型,在视觉感知、逻辑推理、数学竞赛和通用对话等任务中达到 200B 参数模型的性能水平。
阅读原文

EmbodiChain

EmbodiChain 是跨维智能开源的具身智能学习平台,通过生成式仿真数据推动具身智能的发展。自动创建符合物理规律的 3D 场景和任务,结合在线数据流和自我修复...
阅读原文
145678308