AI工具

SimpleAR

SimpleAR 是复旦大学视觉与学习实验室和字节 Seed 团队联合推出的纯自回归图像生成模型。采用简洁的自回归架构,通过优化训练和推理过程,实现了高质量的图像...
阅读原文

Aether

Aether 是上海AI Lab开源的生成式世界模型,完全基于合成数据训练。Aether 首次将三维时空建模与生成式建模深度融合,具备 4D 动态重建、动作条件视频预测和...
阅读原文

飞猪AI问一问

飞猪AI问一问是飞猪推出的多智能体驱动的AI旅行助手。通过多个专业智能助手协同工作,为用户提供从行程规划到预订的一站式旅行服务。用户只需提出需求,如旅...
阅读原文

Desearch

Desearch是专注于深度研究和智能分析的平台,帮助用户高效获取有价值的信息并精准建立研究框架。平台提供了多种研究模式,包括普通模式、深度模式和专家模式...
阅读原文

Gemma 3 QAT

Gemma 3 QAT(Quantization-Aware Training)是谷歌推出的最新一代开源模型,是Gemma 3 的量化优化版本。通过量化感知训练技术,Gemma 3 QAT 在显著降低内存...
阅读原文

7牛AI

7牛AI 是高效便捷的AI PPT生成工具。用户只需输入主题或要点,能快速生成完整的PPT初稿,大大节省制作时间。拥有丰富多样的模板库,涵盖商务、教育、科技等多...
阅读原文

OpenUtau

OpenUtau 是开源的歌声合成工具,兼容 UTAU 音源库和重采样器,支持 VSQX 导入、多语言界面及预渲染功能,帮助创作者快速预览作品节省时间。OpenUtau现代化的...

SkyReels-V2

SkyReels-V2是昆仑万维SkyReels团队推出的无限时长电影生成模型,基于扩散强迫(Diffusion-forcing)框架,结合多模态大语言模型(MLLM)、多阶段预训练、强...
阅读原文

CapWords

CapWords 是创新的语言学习应用,通过 AI 技术让用户能随时随地学习新单词。用拍照功能,将生活中的物品转化为学习内容,识别物体并提供对应的外语单词、发音...
阅读原文

GigaTok

GigaTok 是用于自回归图像生成的视觉分词器,参数量达 30 亿。通过语义正则化技术,将分词器特征与预训练视觉编码器(如 DINOv2)的语义特征对齐,有效约束潜...
阅读原文

必火AI

必火AI是专注于短视频创作的国产AI数字人工具,集成了数字人形象生成、语音合成、视频剪辑等多种功能。用户只需上传3分钟真人视频,可生成高度逼真的数字人形...
阅读原文

HumanRig

HumanRig 是阿里巴巴团队开发的 3D 人形角色自动绑定研究项目。解决现有绑定技术因缺乏高质量数据集而发展受限的问题,通过提供大规模、高质量的数据集和创新...
阅读原文

MineWorld

MineWorld是微软研究院开源的基于《我的世界》(Minecraft)的实时交互式世界模型,基于视觉-动作自回归Transformer架构,将游戏场景和动作转化为离散的token...
阅读原文

FastAPI-MCP

FastAPI-MCP 是将 FastAPI 应用的端点自动转换为符合模型上下文协议(MCP)的开源工具。具有零配置的特点,只需简单指向 FastAPI 应用可自动发现并转换所有端...
阅读原文

扣子空间

扣子空间(Coze Space)是字节跳动推出的通用型 AI Agent,帮助用户快速搭建和管理 AI 应用。通过可视化界面,没有编程基础,用户也能轻松创建。 集成了超过 ...
阅读原文
12627282930229