RAG-Anything

RAG-Anything是香港大学数据智能实验室推出的开源多模态RAG系统。系统支持处理包含文本、图像、表格和公式的复杂文档,提供从文档摄取到智能查询的端到端解决...
阅读原文

Dive3D

Dive3D是北京大学和小红书公司合作推出的文本到3D生成框架。框架基于分数的匹配(Score Implicit Matching,SIM)损失替代传统的KL散度目标,有效避免模式坍...
阅读原文

PreenCut

PreenCut是开源的AI视频剪辑工具,基于WhisperX实现高精度语音转录,结合DeepSeek和豆包API提供语义化搜索和智能剪辑功能。工具具备自动语音转录、AI智能分段...
阅读原文

DeepPiano

DeepPiano 是智曲科技推出的以大模型为内核的钢琴智能应用。通过先进的人工智能技术,为钢琴演奏者和学习者提供多种便捷功能。DeepPiano 能实现智能乐谱翻页...
阅读原文

元智医疗大模型

元智医疗大模型是联影智能推出的面向医疗领域的多模态人工智能模型,通过融合文本、影像、视觉、语音等多种模态数据,为医疗场景提供深度智能化解决方案。
阅读原文

Solar

Solar 是基于人工智能的应用开发平台,帮助企业快速构建全栈应用程序、自动化工作流和智能体。用户可以通过自然语言描述需求,Solar 会自动生成完整的应用程...
阅读原文

MindOmni

MindOmni 是腾讯 ARC Lab 联合清华大学深圳国际研究生院、香港中文大学和香港大学等推出的多模态大型语言模型,基于强化学习算法(RGPO)显著提升视觉语言模...
阅读原文

盘古大模型 5.5

盘古大模型5.5是华为在开发者大会(HDC 2025)上发布的最新一代人工智能大模型。模型强调“不作诗,只做事”,专注于解决实际产业问题,推动千行百业的智能化升...
阅读原文

Stream-Omni

Stream-Omni是中国科学院计算技术研究所智能信息处理重点实验室、中国科学院人工智能安全重点实验室及中国科学院大学联合推出的类似GPT-4o的大型语言视觉语音...
阅读原文

Knowunity

Knowunity是AI学习辅导应用,能帮助学生更高效地学习和备考。应用提供无限的练习测验和抽认卡,覆盖从小学到高中的所有学科,包括AP和SAT等考试。基于拍照功...
阅读原文

OneRec

OneRec 是快手推出的新型端到端生成式推荐系统。采用编码器-解码器架构,通过稀疏 Mixture-of-Experts(MoE)技术提升模型容量,保持高效的计算性能。与传统...
阅读原文

Kimi-Researcher

Kimi-Researcher 是月之暗面旗下的 Kimi 推出的基于端到端自主强化学习(end-to-end agentic RL)技术训练的新一代 Agent 模型,专为深度研究任务而设计。能...
阅读原文

Self Forcing

Self Forcing 是 Adobe Research 与德克萨斯大学奥斯汀分校联合推出的新型自回归视频生成算法,解决传统生成模型在训练与测试时的暴露偏差问题。通过在训练阶...
阅读原文

BASE44

BASE44 是零代码AI应用开发平台,用户可以用自然语言快速生成功能完备的应用程序,无需编写代码。BASE44 将数据库设置、API 集成、邮件服务、身份验证和存储...
阅读原文

SongGeneration

SongGeneration是腾讯AI Lab推出的AI音乐生成大模型。模型支持解决音乐AIGC领域中的音质、音乐性与生成速度等关键问题,SongGeneration基于LLM-DiT融合架构,...
阅读原文
11819202122254