AI项目和框架
Granite-Docling-258M – IBM推出的轻量级视觉语言模型
Granite-Docling-258M 是 IBM 推出的轻量级视觉语言模型,专为高效文档转换设计。模型能将文档转换为机器可读格式,同时完整保留布局、表格、公式等元素。
LSP(Language Self-Play)
LSP(Language Self-Play)是Meta提出的一种强化学习方法,解决大型语言模型对大量高质量训练数据的依赖问题。LSP的核心思想是利用自我博弈的方式,让同一模...
DeepSeek-R1-Safe
DeepSeek-R1-Safe 是浙江大学网络空间安全学院和华为合作推出的基于DeepSeek衍生的安全大模型。模型基于华为昇腾芯片和 MindSpeedLLM 框架,通过构建安全语料...
Xiaomi-MiMo-Audio
Xiaomi-MiMo-Audio是小米开源的首个原生端到端语音大模型。模型基于创新预训练架构和上亿小时训练数据,首次在语音领域实现了基于 In-Context Learning(ICL...
Lucy Edit Dev
Lucy Edit Dev 是 Decart AI 团队开源的基于文本指令的视频编辑模型。能根据简单的文本提示对视频进行多种编辑操作,如更改服装、替换角色、插入对象和转换场...
Wan2.2-Animate
Wan2.2-Animate是阿里通义团队推出的动作生成模型,模型同时支持动作模仿和角色扮演两种模式,能基于表演者的视频,精确复制面部表情和动作,生成高度逼真的...
InternVLA-A1
InternVLA-A1 是上海人工智能实验室和国家地方共建人形机器人创新中心联合发布的具身操作大模型。具备理解、想象、执行一体化的能力,能精准地完成任务。模型...
粤公网安备 44011502001135号