标签:文本
英伟达开源NVLM 1.0屠榜多模态!纯文本性能不降反升
新智元报道编辑:LRS 【新智元导读】NVLM 1.0系列多模态大型语言模型在视觉语言任务上达到了与GPT-4o和其他开源模型相媲美的水平,其在纯文本性能甚至超过了L...
仅用4块GPU、不到3天训练出「开源版GPT-4o」,这是国内团队最新研究
机器之心报道 编辑:小舟、陈陈LLaMA-Omni能够接收语音指令,同步生成文本和语音响应,响应延迟低至 226ms,低于 GPT-4o 的平均音频响应延迟 320ms。以 ChatG...
KG+LM超越传统架构!海德堡提出全新图语言模型GLM | ACL 2024
新智元报道编辑:alan 【新智元导读】近日,来自海德堡大学的研究人员推出了图语言模型 (GLM),将语言模型的语言能力和知识图谱的结构化知识,统一到了同一种...
新SOTA来了:国产9B模型多项得分超4o-mini,中国出海电商已经用上了
茕茕 发自 凹非寺量子位 | 公众号 QbitAI阿里开源,又拿第一了。 这次是在多模态领域: 就在刚刚,阿里国际AI团队开源多模态大模型Ovis1.6。在多模态权威综合...
一张图实现街道级定位,端到端图像地理定位大模型AddressCLIP登ECCV2024
AddressCLIP项目组 投稿量子位 | 公众号 QbitAI拔草星人的好消息来啦! 中科院自动化所和阿里云一起推出了街景定位大模型,只要一张照片就能实现街道级精度的...
面壁小钢炮 3.0 重磅发布!“无限”长文本,性能超 Kimi
整理 | 褚杏娟 近日,面壁智能宣布,旗舰端侧模型面壁「小刚炮」系列进化为全新 MiniCPM 3.0 基座模型,再次以小博大,以 4B 参数,带来超越 GPT-3.5 的性能...
反向和错位图灵测试:GPT-4比人类更「人性化」!
新智元报道编辑:lumina 【新智元导读】加州大学的研究人员通过反向和错位图灵测试,探讨了人类和AI在区分对话者是人类还是AI时的能力。但结果表明,在不进行...
老黄预言成真!Roblox官宣AI秒生3D物体模型,引爆10亿玩家游戏新世界
新智元报道编辑:桃子 乔杨 【新智元导读】老黄预言AI生成游戏的未来,很快就要实现了!在一年一度Roblox开发者大会上,CEO官宣了3D基础模型,仅用文本提示便...
让大模型能听会说,国内机构开源全球首个端到端语音对话模型Mini-Omni
AIxiv专栏是机器之心发布学术、技术内容的栏目。过去数年,机器之心AIxiv专栏接收报道了2000多篇内容,覆盖全球各大高校与企业的顶级实验室,有效促进了学术...
4B小模型掀翻大模型牌桌!性能超GPT-3.5,无限长文本性能超Kimi…
杀疯了!杀疯了! 你敢相信 4B 参数小模型,性能却超越千亿量级的 GPT-3.5 ! OpenAI、谷歌、微软、苹果等一众海内外巨头还没做到的事,被一家中国大模型公司...
智谱清言 App 全新升级视频通话功能,并推出新一代基座大模型
整理 | 褚杏娟 近日,智谱宣布清言 App 推出“视频通话”功能,同时官宣了新一代基座大模型 GLM-4-Plus,此外还将 CogVideoX-5B 开源、GLM-4-Flash 免费。全新...
智谱携基座大模型 GLM-4-Plus 亮相 KDD,清言 app 全新升级视频通话功能
最新基座大模型 GLM-4-Plus发布并上线开放平台! 在 KDD 国际数据挖掘与知识发现大会上,智谱 GLM 团队介绍了新一代基座大模型GLM-4-Plus。GLM-4-Plus 是智谱...
模型小,还高效!港大最新推荐系统EasyRec:零样本文本推荐能力超越OpenAI、Bert
新智元报道编辑:LRST 【新智元导读】EasyRec利用语言模型的语义理解能力和协同过滤技术,提升了在零样本学习场景下的推荐性能。通过整合用户和物品的文本描...
腾讯版GPT-4o开源平替方案:VITA
生成式AI时代最火AI芯片峰会下月来袭!9月6-7日,智猩猩发起主办的2024全球AI芯片峰会将在北京盛大举行。峰会设有开幕式、数据中心AI芯片专场、边缘/端侧AI芯...
RTX3090可跑,360AI团队开源最新视频模型FancyVideo,红衣大叔都说好
AIxiv专栏是机器之心发布学术、技术内容的栏目。过去数年,机器之心AIxiv专栏接收报道了2000多篇内容,覆盖全球各大高校与企业的顶级实验室,有效促进了学术...