豆包4.0美化精修实测:6 大日常玩法,新手也能轻松出质感图
我是小陶。一个专注AI学习成长、致力于用AI工具提升效率的自媒体人。最近,豆包推出了新一代的图像创作模型【Seedream 4.0】。小陶也分享豆包4.0在“单图图生...
真卷啊!据传Claude 4.5和Gemini 3.0即将发布
小红书发布FireRedTTS-2,助力AI播客制作简介:小红书智创音频团队推出FireRedTTS-2,一款先进的对话合成模型,显著提升语音合成的自然度和真实感。它支持音...
开源进阶版Nano Banana UI,支持局部涂选、连续编辑,比官方更好用。
Nano Banana最近大家应该都玩的很溜了,搞来搞去就那些玩法,可能新鲜感也弱了些。AI大部分的新东西都有这个特点,刚出来的时候大家都感觉很有趣,跟风去玩,...
InfiniteTalk
InfiniteTalk是美团视觉智能部推出的新型数字人驱动技术,通过稀疏帧video dubbing范式,仅需少量关键帧能驱动数字人人生成自然流畅的视频,解决传统技术中口...
清华炸场!AI 大模型天梯榜来了,选模型不再头秃。
周六在杭州有一个 GOSIM 大会。这个大会上,清华大学联合中软评测中心发布了《2025 大模型服务性能排行榜》。这个排行榜挺有意思的,它不是对比各个 AI 大模...
GPT-5-Codex 发布,可以7小时连续编程,但OpenAI 封杀了API。。
凌晨一点,OpenAI 发布了 GPT-5-Codex,但这次,所有想调用 API 的开发者可能要失望了。OpenAI 做了一个决定:Codex 并不通过 API 开放。你不能靠 key 来偷偷...
Lumina-DiMOO
Lumina-DiMOO是上海人工智能实验室等机构开源的新一代多模态生成与理解模型。模型采用全离散扩散架构,统一处理文本、图像等多模态数据,支持文本到图像生成...
UnifoLM-WMA-0
UnifoLM-WMA-0 是宇树科技开源的跨多类机器人本体的世界模型 - 动作架构,专为通用机器人学习设计。核心是世界模型,能理解机器人与环境的物理交互,具备仿真...
真人手办建模!腾讯混元3D 3.0来了
腾讯混元3D 3.0模型,来了!建模精度提升3倍,几何分辨率高达1536³,支持36亿体素超高清建模,细节表现力显著增强,为用户带来前所未有的3D内容创作体验。从...
GPT-5-Codex
GPT-5-Codex 是 OpenAI 推出的专为编程优化的模型,基于 GPT-5 进一步强化。模型聚焦于真实世界的软件工程任务,如从零搭建项目、代码重构、调试、测试和代码...
Grok 4 Fast
Grok 4 Fast是xAI推出的快速版人工智能模型,最大的特点是响应速度快,最高可达标准版的10倍,生成速度每秒75个token,能快速完成简单查询、基础代码生成等任...
粤公网安备 44011502001135号