AI项目和框架
AutoCodeBench
AutoCodeBench 是腾讯混元推出的专门测评大模型代码能力基准测试集,包含 3920 个问题,均匀分布在 20 种编程语言中。数据集具有高难度、实用性和多样性,能...
NVIDIA Nemotron Nano 2
NVIDIA Nemotron Nano 2 是英伟达推出的高效推理模型,参数量为9B。模型基于混合Mamba-Transformer架构,在20万亿个token上预训练,支持128k上下文长度。
Klear-Reasoner
Klear-Reasoner 是快手推出的基于 Qwen3-8B-Base 的推理模型,专注于提升数学和代码推理能力。模型通过长思维链监督微调(long CoT SFT)和强化学习(RL)训...
Nano Banana
Nano Banana 是 AI 图像编辑模型,目前仅在 LMArena 网站上随机出现。模型因极高的人物一致性著称,能精准还原人物的面部特征和表情,同时在背景替换和风格转...
Matrix-Game 2.0
Matrix-Game 2.0 是昆仑万维 SkyWork AI 发布的自研世界模型。是业内首个开源的通用场景实时长序列交互式生成模型,全面开源,推动交互式世界模型领域的发展...
MiroThinker
MiroThinker 是开源的智能体模型系列,专为深度研究和复杂、长期问题解决而设计。模型基于 Qwen3 构建,具备任务分解、多跳推理、检索增强生成、代码执行、网...
Baichuan-M2
Baichuan-M2 是百川智能推出的开源医疗增强大模型。在医疗领域表现卓越,于HealthBench评测中以60.1分超越OpenAI的gpt-oss120b等众多开源模型,登顶世界第一...
SkyReels-A3
SkyReels-A3是昆仑万维推出的先进AI模型,基于DiT(Diffusion Transformer)视频扩散架构,结合插帧、强化学习和运镜控制技术。模型能通过音频驱动,将照片或...