AI工具

Mu

Mu是微软推出的小参数语言模型,仅3.3亿参数,支持在 NPU 和边缘设备上高效运行。模型基于编码器解码器架构,基于硬件感知优化、模型量化及特定任务微调,实...
阅读原文

Hunyuan-GameCraft

Hunyuan-GameCraft 是腾讯 Hunyuan 团队和华中科技大学共同推出的高动态交互式游戏视频生成框架。基于将键盘和鼠标输入统一到共享的相机表示空间,实现精细的...
阅读原文

探饭

探饭是字节跳动旗下抖音推出的AI饭搭子。探饭基于豆包大模型,为用户提供全方位的美食智能向导服务,包括探店推荐、菜品推荐、美食攻略、AI点菜等。支持用户...
阅读原文

万兴天幕AI

万兴天幕AI是万兴科技推出的AI音视频多媒体创作平台,专注于数字创意领域,具备强大的多模态生成与理解能力。能实现文生视频、图生视频、视频续写等功能,支...
阅读原文

墨刀AIPPT

墨刀AIPPT是AI驱动的PPT创作工具,基于智能技术显著简化PPT制作流程。用户只需输入一个主题或导入相关文档,AI能自动生成结构完整、设计统一且内容丰富的PPT。
阅读原文

Comate AI IDE

Comate AI IDE是百度文心快码推出的行业首个多模态、多智能体协同的AI原生IDE工具。具备强大的多模态能力,支持设计稿一键转代码(F2C)、图片转代码以及自然...
阅读原文

Confucius3-Math

Confucius3-Math是网易有道开源的“子曰3”系列大模型中的数学模型,是国内首个专注于数学教育的开源推理模型。具有140亿参数,专为K-12数学教育场景优化,可在...
阅读原文

Lingshu

Lingshu是阿里巴巴达摩院推出的专注于医学领域的多模态大型语言模型。模型支持超过12种医学成像模态,包括X光、CT扫描、MRI等,在多模态问答、文本问答及医学...
阅读原文

CreateVision AI

CreateVision AI 是AI图像生成平台,平台融合 Flux.1 Dev 和 GPT-Image-1 两大顶级模型,为用户提供开源与闭源技术路线的极致体验。平台支持用户将创意想法瞬...
阅读原文

Ring-lite

Ring-lite是蚂蚁技术AntTech团队推出的基于MoE架构的轻量级推理模型。模型用Ling-lite-1.5为基础,基于独创的C3PO强化学习训练方法,在多项推理Benchmark上达...
阅读原文

PosterCraft

PosterCraft是香港科技大学(广州)和美团等机构推出的用在生成高质量美学海报的统一框架。框架摒弃模块化设计流程和固定的预定义布局,支持模型自由探索连贯...
阅读原文

MoFlow

MoFlow 是结合心理学与 AI 技术的情绪管理应用。基于书写、聊天等方式,帮助用户舒缓情绪,洞察情绪底层驱动因素,提升情绪调节能力。基于认知行为疗法(CBT...
阅读原文

RAG-Anything

RAG-Anything是香港大学数据智能实验室推出的开源多模态RAG系统。系统支持处理包含文本、图像、表格和公式的复杂文档,提供从文档摄取到智能查询的端到端解决...
阅读原文

Dive3D

Dive3D是北京大学和小红书公司合作推出的文本到3D生成框架。框架基于分数的匹配(Score Implicit Matching,SIM)损失替代传统的KL散度目标,有效避免模式坍...
阅读原文

PreenCut

PreenCut是开源的AI视频剪辑工具,基于WhisperX实现高精度语音转录,结合DeepSeek和豆包API提供语义化搜索和智能剪辑功能。工具具备自动语音转录、AI智能分段...
阅读原文
145678241