Codexia

Codexia是强大的跨平台AI编码桌面应用程序,支持为OpenAI Codex CLI提供图形界面和工具集,增强开发体验。
阅读原文

Lego-Edit

Lego-Edit 是小米开源的基于指令的图像编辑框架,通过多模态大语言模型(MLLM)的泛化能力,实现对图像的灵活编辑。采用模型级工具包,包含多种高效训练的模...
阅读原文

美团提出统一多模态模型OneCAT,一键搞定视觉问答/图像编辑/文生图任务,性能表现SOTA。

添加微信号:AIGC_Tech,公众号小助手会拉你进群!扫描下方二维码,加入AIGC Studio知识星球!可以获得最新AI前沿应用/AIGC实践教程/大厂面试经验/算法刷题和...
阅读原文

混元3D Studio

混元3D Studio(Hunyuan3D Studio)是腾讯推出的一站式3D创作平台,基于AI技术加速3D内容创作全流程。平台支持从概念设计到动画制作的各个环节,包括高效的概...
阅读原文

CapCut AI Suite

CapCut AI Suite 是字节推出的 AI 驱动的创意编辑工具,能将任何主题快速转化为完整视频,提供 AI 图像、视频、音乐生成等功能,支持自动剪辑、转录、翻译等...
阅读原文

FastMTP

FastMTP 是腾讯自研的大语言模型(LLM)推理加速技术,通过优化多标记预测(MTP)技术,用共享权重的单 MTP 头替代传统多独立模块,结合语言感知词汇压缩和自...
阅读原文

Xiaomi-MiMo-Audio

Xiaomi-MiMo-Audio是小米开源的首个原生端到端语音大模型。模型基于创新预训练架构和上亿小时训练数据,首次在语音领域实现了基于 In-Context Learning(ICL...
阅读原文

Lucy Edit Dev

Lucy Edit Dev 是 Decart AI 团队开源的基于文本指令的视频编辑模型。能根据简单的文本提示对视频进行多种编辑操作,如更改服装、替换角色、插入对象和转换场...
阅读原文

Wan2.2-Animate

Wan2.2-Animate是阿里通义团队推出的动作生成模型,模型同时支持动作模仿和角色扮演两种模式,能基于表演者的视频,精确复制面部表情和动作,生成高度逼真的...
阅读原文

Ling-V2

Ling-V2 是蚂蚁百灵团队推出的基于 MoE 架构的大型语言模型家族,首个版本 Ling-mini-2.0 拥有 160 亿总参数,每个输入标记仅激活 14 亿参数。
阅读原文

Viking 长期记忆

Viking长期记忆是火山引擎推出的端到端长期记忆标准产品,基于自研VikingDB向量数据库,具备百亿级数据毫秒级检索能力,能精准抽取事件与用户画像,支持语义...
阅读原文

即梦图片4.0上线4K直出,这就是AI人像的新巅峰。

起猛了,即梦上线4K直出了。而且,免费。我在上周,就写过一篇即梦4.0的玩法:即梦图片4.0来了,我整理了10个好用到爆的进阶玩法。在当时,即梦只支持2K分辨...
阅读原文

建议收藏!Google+即梦+豆包三大官方AI绘图提示词手册,终于有人整理全了!

⬆️ 关注我,探索实用的 AI 技巧,一起享受 AI 时代的红利。大家好,我是闪闪!这是我的第 3 篇原创。昨天晚上,我在各种 AI 绘图群里潜水的时候,看到一些小...
阅读原文

Oakley Meta Vanguard

Oakley Meta Vanguard 是Meta推出的面向运动与极客人群的智能眼镜,采用防风镜造型,配备中央广角摄像头、长续航和运动数据整合功能,配有训练提醒灯。
阅读原文

VoxCPM

VoxCPM 是面壁智能与清华大学深圳国际研究生院联合开发的 0.5B 参数语音生成模型。在语音合成的自然度、音色相似度及韵律表现力方面达到了业界顶尖水平。VoxC...
阅读原文