OmniAudio-2.6B

OmniAudio-2.6B是Nexa AI推出的音频语言模型,专为边缘部署设计,能实现快速且高效的音频文本处理。OmniAudio-2.6B是具有2.6亿参数的多模态模型融合Gemma-2-2...
阅读原文

DreamOmni

DreamOmni 是香港中文大学、字节跳动和香港科技大学共同推出的统一图像生成和编辑模型。模型整合文本到图像(T2I)生成和多种编辑任务,包括指令式编辑、修复...
阅读原文

苹果无边框 iPhone 被曝要推迟,但「无边泳池」不远了

原标题:苹果无边框 iPhone 被曝要推迟,但「无边泳池」不远了 文章来源:爱范儿 内容字数:6230字苹果与无边框iPhone的追逐:技术与设计的博弈 本文探讨了...
阅读原文

inD广州艺术书展2025|书摊全名单公开,早鸟票最后1天!

?inD广州艺术书展\x0a?2025.1.3-1.6\x0a?越秀区北京路
阅读原文

模拟生命体,智源线虫登上Nature子刊封面,探索AGI的第三条路径

首次实现秀丽线虫神经系统、身体与环境的闭环仿真
阅读原文

哪家AI能成卧底之王?淘天技术团队发布多智能体博弈游戏平台WiS

WiS 平台揭示了 LLMs 在多智能体环境中的潜能与局限性。
阅读原文

首次!大模型自动搜索人工生命,做出AI科学家的Sakana AI又放大招

用 AI 加速人工生命发现可以启发下一代 AI 系统。
阅读原文

DisPose技术革新:轻松输入动作视频,参照目标人物,即刻让任何人模仿同一支舞蹈动作

原标题:DisPose技术革新:轻松输入动作视频,参照目标人物,即刻让任何人模仿同一支舞蹈动作 文章来源:小夏聊AIGC 内容字数:1899字让静态图像“动”起来:Di...
阅读原文

腾讯联合智源发布升级版长文本理解基准测试模型—LongBench v2

原标题:腾讯联合智源发布升级版长文本理解基准测试模型—LongBench v2 文章来源:小夏聊AIGC 内容字数:1502字LongBench v2:衡量大型语言模型长文本理解能力...
阅读原文

Hume AI推出全能语音引擎OCTAVE:一键转换文本为逼真语音,精准复制个人声音特质

原标题:Hume AI推出全能语音引擎OCTAVE:一键转换文本为逼真语音,精准复制个人声音特质 文章来源:小夏聊AIGC 内容字数:1535字HumeAI的OCTAVE引擎:语音生...
阅读原文

AWS发布多智能体协调器:一键简化高级AI系统运维复杂度

原标题:AWS发布多智能体协调器:一键简化高级AI系统运维复杂度 文章来源:小夏聊AIGC 内容字数:1628字AWS Multi-Agent Orchestrator:简化复杂AI系统开发的...
阅读原文

科大讯飞联合多家企业共同设立5亿元人工智能创业投资基金

原标题:科大讯飞联合多家企业共同设立5亿元人工智能创业投资基金 文章来源:小夏聊AIGC 内容字数:1290字安徽科讯人工智能创业投资基金:5亿巨资助力AI产业...
阅读原文

阿里云百炼大模型服务平台再升级,全新“音视频实时互动”功能助力多模态AI应用轻松构建

原标题:阿里云百炼大模型服务平台再升级,全新“音视频实时互动”功能助力多模态AI应用轻松构建 文章来源:小夏聊AIGC 内容字数:1724字阿里云百炼:零编程基...
阅读原文