标签:文本

一张图实现街道级定位,端到端图像地理定位大模型AddressCLIP登ECCV2024

AddressCLIP项目组 投稿量子位 | 公众号 QbitAI拔草星人的好消息来啦! 中科院自动化所和阿里云一起推出了街景定位大模型,只要一张照片就能实现街道级精度的...
阅读原文

面壁小钢炮 3.0 重磅发布!“无限”长文本,性能超 Kimi

整理 | 褚杏娟 近日,面壁智能宣布,旗舰端侧模型面壁「小刚炮」系列进化为全新 MiniCPM 3.0 基座模型,再次以小博大,以 4B 参数,带来超越 GPT-3.5 的性能...
阅读原文

反向和错位图灵测试:GPT-4比人类更「人性化」!

新智元报道编辑:lumina 【新智元导读】加州大学的研究人员通过反向和错位图灵测试,探讨了人类和AI在区分对话者是人类还是AI时的能力。但结果表明,在不进行...
阅读原文

老黄预言成真!Roblox官宣AI秒生3D物体模型,引爆10亿玩家游戏新世界

新智元报道编辑:桃子 乔杨 【新智元导读】老黄预言AI生成游戏的未来,很快就要实现了!在一年一度Roblox开发者大会上,CEO官宣了3D基础模型,仅用文本提示便...
阅读原文

让大模型能听会说,国内机构开源全球首个端到端语音对话模型Mini-Omni

AIxiv专栏是机器之心发布学术、技术内容的栏目。过去数年,机器之心AIxiv专栏接收报道了2000多篇内容,覆盖全球各大高校与企业的顶级实验室,有效促进了学术...
阅读原文

4B小模型掀翻大模型牌桌!性能超GPT-3.5,无限长文本性能超Kimi…

杀疯了!杀疯了! 你敢相信 4B 参数小模型,性能却超越千亿量级的 GPT-3.5 ! OpenAI、谷歌、微软、苹果等一众海内外巨头还没做到的事,被一家中国大模型公司...
阅读原文

智谱清言 App 全新升级视频通话功能,并推出新一代基座大模型

整理 | 褚杏娟 近日,智谱宣布清言 App 推出“视频通话”功能,同时官宣了新一代基座大模型 GLM-4-Plus,此外还将 CogVideoX-5B 开源、GLM-4-Flash 免费。全新...
阅读原文

智谱携基座大模型 GLM-4-Plus 亮相 KDD,清言 app 全新升级视频通话功能

最新基座大模型 GLM-4-Plus发布并上线开放平台! 在 KDD 国际数据挖掘与知识发现大会上,智谱 GLM 团队介绍了新一代基座大模型GLM-4-Plus。GLM-4-Plus 是智谱...
阅读原文

模型小,还高效!港大最新推荐系统EasyRec:零样本文本推荐能力超越OpenAI、Bert

新智元报道编辑:LRST 【新智元导读】EasyRec利用语言模型的语义理解能力和协同过滤技术,提升了在零样本学习场景下的推荐性能。通过整合用户和物品的文本描...
阅读原文

腾讯版GPT-4o开源平替方案:VITA

生成式AI时代最火AI芯片峰会下月来袭!9月6-7日,智猩猩发起主办的2024全球AI芯片峰会将在北京盛大举行。峰会设有开幕式、数据中心AI芯片专场、边缘/端侧AI芯...
阅读原文

RTX3090可跑,360AI团队开源最新视频模型FancyVideo,红衣大叔都说好

AIxiv专栏是机器之心发布学术、技术内容的栏目。过去数年,机器之心AIxiv专栏接收报道了2000多篇内容,覆盖全球各大高校与企业的顶级实验室,有效促进了学术...
阅读原文

语言图像模型大一统!Meta将Transformer和Diffusion融合,多模态AI王者登场

来源:新智元编辑:Aeneas 好困 【导读】就在刚刚,Meta最新发布的Transfusion,能够训练生成文本和图像的统一模型了!完美融合Transformer和扩散领域之后,...
阅读原文

统一transformer与diffusion!Meta融合新方法剑指下一代多模态王者

机器之心报道 编辑:陈陈本文引入了 Transfusion,这是一种可以在离散和连续数据上训练多模态模型的方法。一般来说,多模态生成模型需要能够感知、处理和生成...
阅读原文

ECCV 2024 | 机器遗忘之后,扩散模型真正安全了吗?

AIxiv专栏是机器之心发布学术、技术内容的栏目。过去数年,机器之心AIxiv专栏接收报道了2000多篇内容,覆盖全球各大高校与企业的顶级实验室,有效促进了学术...
阅读原文

一句话生成《黑神话:悟空》3D资产,胡渊鸣创业项目Meshy上新,免费试用

机器之心报道 编辑:佳琪、张倩几何更干净、细致,工作流更合理,Meshy的3D生成能力又进化了,所有人都可以免费试用。天命人,你现在已经到哪儿了? 毫无疑问...
阅读原文
12320