标签:能力
让大模型能听会说,国内机构开源全球首个端到端语音对话模型Mini-Omni
AIxiv专栏是机器之心发布学术、技术内容的栏目。过去数年,机器之心AIxiv专栏接收报道了2000多篇内容,覆盖全球各大高校与企业的顶级实验室,有效促进了学术...
支付宝突然推出新App,竟想用AI让日常生活开挂
机器之心原创 作者:吴昕只是装了一个 App,整个生活就 AI 了 。家人们,支付宝已经这么「炸场」了吗? 输入「买一张周日的高铁票,从北京到武汉, 下午出发...
大模型对 AI Infra 的重构之:LLMOps
4-5年前投资人对 AI 的投资热情刚刚褪去不久,大模型就在资本寒冬再次掀起了投资人的热情,这次有什么不同?大模型,投资人看到多,却出手的少,好像将 4-5 ...
一款小而强大的编程助手:零一万物正式开源Yi-Coder系列模型
在 AI 领域中,代码生成和编辑工具一直是开发者们关注的焦点。 今天,零一万物开源了 Yi-Coder 系列模型,它作为 Yi 系列模型家族中的“编程小能手”,展现了卓...
前OpenAI首席科学家新公司获10亿美元融资,公司仅 10 人
点击上方蓝字关注我们“由前OpenAI首席科学家Ilya Sutskever联合创立的安全超级智能(SSI)公司,已筹集10亿美元资金,旨在开发超越人类智能的安全AI系统。据...
覆盖 7 百万问答数据,上海 AI Lab 发布 ChemLLM,专业能力比肩 GPT-4
作者:李姝 编辑:李姝,李宝珠 化学大语言模型 ChemLLM 是首个兼备化学专业能力和对话、推理等通用能力的开源大模型。目前 HyperAI超神经官网 (hyper.ai) 已...
通义千问开源视觉语言模型 Qwen2-VL,可理解 20 分钟以上视频
整理 | 褚杏娟 2023 年 8 月,通义千问开源第一代视觉语言理解模型 Qwen-VL,成为开源社区最受欢迎的多模态模型之一。短短一年内,模型下载量突破 1000 万次...
一手实测结果出炉!智谱「超大杯」模型全家桶亮相KDD,部分任务超越GPT-4o
机器之心报道 编辑:张倩、杜伟在与 GPT-4o 的全面较量中,GLM-4-Plus 已经可以在大多数任务上做到逼近甚至在某些任务上实现了超越。还有 One More Thing:清...
站上风口后,具身智能的重新定义与行业真相|甲子光年
概念的火热程度跟它实际在全世界吸引到的真实资源有误差。近日,HICOOL全球创业者峰会举行了一次围绕“人工智能的新物种与老伙计”的圆桌讨论,特别聚焦于具身...
MM 2024 Oral: 大模型带你鉴赏世界名画!同济大学发布
夕小瑶科技说 原创作者 | 谢年年现有的大模型已经能够创作令人惊叹画作,那鉴赏艺术画作岂不是信手拈来? 但同济大学的研究团队却发现——并非如此。 他们发现...
超越GPT-4o!阿里发布最强开源多模态模型Qwen2-VL,支持实时视频对话
克雷西 发自 凹非寺量子位 | 公众号 QbitAI新的最强开源多模态大模型来了! 阿里Qwen2大模型家族新添多模态模型Qwen2-VL,在图像和长视频理解任务上双双取得...
国产!首个实时视频交互的功能面世,智谱硬实力炸场KDD顶会
夕小瑶科技说 原创作者 | 夕小瑶编辑部今天的文章,必须放一个视频来作为开头。 你以为是OpenAI终于发布实时视频交互的GPT-4o了? No!No! OpenAI的拖延症已...
全国首个上手机的AI视频通话来了!《黑神话:悟空》经文也能破译
金磊 明敏 发自 凹非寺量子位 | 公众号 QbitAI免费的AI视频通话功能,就这么水灵灵地来了。 之前B站Up主“女流姐”在直播《黑神话:悟空》的时候,科普游戏内的...
NeurIPS'24「组合学习」Workshop,开启征稿啦!MIT、DeepMind等大佬齐聚
Compositional Learning 投稿量子位 | 公众号 QbitAINeurIPS 2024以“组合学习:观点、方法、及展望”为主题的Workshop开启征稿啦~ 组合学习受到人类天生能够...
智谱携基座大模型 GLM-4-Plus 亮相 KDD,清言 app 全新升级视频通话功能
最新基座大模型 GLM-4-Plus发布并上线开放平台! 在 KDD 国际数据挖掘与知识发现大会上,智谱 GLM 团队介绍了新一代基座大模型GLM-4-Plus。GLM-4-Plus 是智谱...