AI项目和框架

InstanceAssemble

InstanceAssemble 是小红书与复旦大学联合推出的轻量级的布局到图像生成框架。框架通过创新的“实例组装注意力”机制,实现从简单到复杂、从稀疏到密集布局的精...
阅读原文

Zen Browser

Zen Browser 是基于Firefox 内核的开源浏览器,能通过高效的设计和强大的功能提升用户生产力。Zen Browser用垂直标签页和侧边栏布局,优化宽屏显示器的使用体...
阅读原文

QwenLong-L1.5

QwenLong-L1.5 是阿里通义实验室推出的专注于长文本推理的大语言模型。模型基于 Qwen3-30B-A3B 架构,通过系统化的后训练方案,显著提升长文本推理能力。
阅读原文

ML-Master 2.0

ML-Master 2.0 是上海交通大学人工智能学院、上海算法创新研究院、深势科技组成的SciMaster团队推出的面向真实机器学习科研任务的自主智能体。ML-Master 2.0...
阅读原文

Infographic

Infographic 是阿里前端 AntV 团队开源的新一代信息图框架。框架基于 G2 可视化引擎和 Ant Design,能快速生成高质量、稳定的信息图。
阅读原文

FrontierScience

FrontierScience是OpenAI推出的科学AI能力评估基准,专门测试大模型在物理、化学、生物领域的专家级推理能力。包含两个子集:奥林匹克赛道(100道竞赛级短答...
阅读原文

QuantiPhy

QuantiPhy 是斯坦福大学李飞飞团队推出的首个量化评估视觉 - 语言模型(VLM)物理推理能力的基准。QuantiPhy 通过 3300 多个视频 - 文本实例,要求模型基于视...
阅读原文

TurboDiffusion

TurboDiffusion 是清华大学、生数科技和加州大学伯克利分校联合推出的视频生成加速框架。框架通过 SageAttention、SLA(稀疏线性注意力)和 rCM(时间步蒸馏...
阅读原文

Seed Prover 1.5

Seed Prover 1.5 是字节跳动 Seed 团队推出的新一代形式化数学推理模型。模型采用创新的 Agentic Prover 架构,通过大规模强化学习(Agentic RL)训练,显著...
阅读原文

MedASR

MedASR 是 Google 推出的专注于医学领域的语音识别模型,基于 Conformer 架构,拥有 105M 参数。模型通过大量医学语音数据(约 5000 小时)进行预训练,涵盖...
阅读原文

Fun-Audio-Chat

Fun-Audio-Chat是阿里云通义百聆团队开源的新一代端到端语音交互模型,具备语音理解、情感感知和任务执行能力。模型采用双分辨率设计,通过5Hz和25Hz帧率协同...
阅读原文

MiniMax M2.1

MiniMax M2.1 是 MiniMax推出的多语言编程AI 模型。模型系统性提升了 Rust、Java、Golang 等多语言能力,覆盖从底层到应用层开发。
阅读原文

PromptFill

PromptFill是专为AI绘画设计的结构化提示词生成工具,通过可视化填空交互帮助用户快速构建复杂Prompt。解决了传统提示词记忆过载、语法混乱和复用性差的问题...
阅读原文

GLM-4.7

GLM-4.7 是智谱AI推出的开源模型,专注于提升编码能力、推理能力和工具协同。模型在多语言编程、复杂任务规划、前端设计美学等方面表现出色,支持多种编程框...
阅读原文

NitroGen

NitroGen 是英伟达联合斯坦福大学、加州理工学院等机构开发的开源通用游戏 AI 模型。基于4万小时、涵盖1000多款游戏的视频数据进行训练,采用大规模行为克隆...
阅读原文
123162