VLAC

VLAC是上海人工智能实验室发布的具身奖励大模型。以InternVL多模态大模型为基础,融合互联网视频数据和机器人操作数据,为机器人在真实世界中的强化学习提供...
阅读原文

Orchids

Orchids 是全球首款具备全栈开发能力的 AI 工具,能实现从前端到后端的全流程开发。工具在 UI 设计和全栈开发性能上表现卓越,超越多个主流竞品,如 Lovable...
阅读原文

RustGPT

RustGPT 是用 Rust 编写的 Transformer 架构语言模型。RustGPT从零开始构建,不依赖任何外部机器学习框架,仅用 ndarray 进行矩阵运算。
阅读原文

GPT-5和Gemini谁更强?——一个在读博士科研日常视角的分析

我先说一下我自己的使用日常:具体包括但不限于调研、一些比较脏活累活性质的整理工作(Notion文档等等)、coding、加上一些谈天说地的八卦吹牛皮等等。调研...
阅读原文

PromptEnhancer

PromptEnhancer是腾讯混元团队开源的用在提升文本到图像(T2I)模型的提示重写框架,通过思维链(Chain-of-Thought,CoT)提示重写和专用的奖励模型AlignEval...
阅读原文

MasterGo Agent

MasterGo Agent是MasterGo AI推出的全球首个数字界面生产级AI Agent,支持基于设计系统(DSM)的文生UI,能调用团队已有设计规范,实现高效协作和生产。
阅读原文

Nano Bananary

Nano Bananary(香蕉超市) 是开源的图像编辑工具,基于 Google Gemini 图像模型开发,支持中文界面和明暗主题切换,提供 50 多种图像转换效果,无需复杂提示...
阅读原文

数说Social Research

数说Social Research 是数说故事旗下的全能营销 Agent 工具,依托领先大模型技术,接入海量社交媒体数据,能快速解答营销、市场、消费者口碑等专业问题并生成...
阅读原文

Bilibili发布IndexTTS2语音模型:情感与时长可控的语音合成技术突破!

今天要聊的主角是——Bilibili的IndexTTS2语音模型。作为一款专为语音合成设计的AI工具,IndexTTS2自2025年发布以来,已经迅速吸引了大量关注,特别是在情感控...
阅读原文

蚂蚁集团在2025Inclusion·外滩大会上正式发布全球首个智能眼镜可信连接技术框架— gPass

如今,AI眼镜被不少人看作是下一代智能终端的潜力股,市场潜力肉眼可见。但仔细观察就会发现,这个行业还处在起步阶段,面临着不少让人头疼的问题。清华大学...
阅读原文

跨境支付难题:塔塔支付科技如何赋能亚洲数字商务新生态

引言:亚洲支付市场的黄金时代 2025年,亚洲数字支付市场正经历着前所未有的变革浪潮。印度数字支付市场预计到2030年将达到9580亿美元,年复合增长率高达18.5...
阅读原文

豆包4.0美化精修实测:6 大日常玩法,新手也能轻松出质感图

我是小陶。一个专注AI学习成长、致力于用AI工具提升效率的自媒体人。最近,豆包推出了新一代的图像创作模型【Seedream 4.0】。小陶也分享豆包4.0在“单图图生...
阅读原文

真卷啊!据传Claude 4.5和Gemini 3.0即将发布

小红书发布FireRedTTS-2,助力AI播客制作简介:小红书智创音频团队推出FireRedTTS-2,一款先进的对话合成模型,显著提升语音合成的自然度和真实感。它支持音...
阅读原文

Evoker

Evoker 是一站式 AI 创作平台,激发创意灵感并加速创作过程。支持文本、图像和视频生成,提供多模态创作体验。用户可以在一个聊天框中轻松创作和完善作品,平...
阅读原文

开源进阶版Nano Banana UI,支持局部涂选、连续编辑,比官方更好用。

Nano Banana最近大家应该都玩的很溜了,搞来搞去就那些玩法,可能新鲜感也弱了些。AI大部分的新东西都有这个特点,刚出来的时候大家都感觉很有趣,跟风去玩,...
阅读原文