标签:文本

真·降维打击,Sora与Runway、Pika的对比来了,震撼效果背后是物理引擎模拟现实世界

机器之心报道 编辑:杜伟以后的视频生成领域,恐怕真的只有 OpenAI 的 Sora 和其他模型了。昨天,OpenAI 发布的首个文本生成视频模型 Sora 引爆了社区,其生...
阅读原文

文生图新SOTA!Pika北大斯坦福联合推出RPG,多模态助力解决文生图两大难题

新智元报道编辑:alan 【新智元导读】近日,北大、斯坦福、以及Pika Labs发布了新的开源文生图框架,利用多模态LLM的能力成功解决文生图两大难题,表现超越SD...
阅读原文

谷歌Gemini 1.5深夜爆炸上线,史诗级多模态硬刚GPT-5!最强MoE首破100万极限上下文纪录

新智元报道编辑:好困 Aeneas 【新智元导读】刚刚,我们经历了LLM划时代的一夜。谷歌又在深夜发炸弹,Gemini Ultra发布还没几天,Gemini 1.5就来了。卯足劲和...
阅读原文

普林斯顿DeepMind用数学证明:LLM不是随机鹦鹉!「规模越大能力越强」有理论根据

新智元报道编辑:拉燕 【新智元导读】普林斯顿大学和DeepMind的科学家用严谨的数学方法证明了大语言模型不是随机鹦鹉,规模越大能力一定越大。今天故事的主角...
阅读原文

胡渊鸣创业公司Meshy产品升级:文本转3D,25秒就能出预览

机器之心报道 编辑:张倩Meshy-2 的文本转 3D、图像转 3D、文本到纹理效果均有所提升。刚刚,胡渊鸣创业公司 Meshy 官宣了他们的第二代产品 ——Meshy-2。Meshy...
阅读原文

GPT-4V只能排第二!华科大等发布多模态大模型新基准:五大任务14个模型全面测评

新智元报道编辑:LRS 好困 【新智元导读】华中科技大学联合华南理工大学、北京科技大学等机构的研究人员对14个主流多模态大模型进行了全面测评,涵盖5个任务...
阅读原文

匿名论文提出奇招!增强大模型长文本能力居然还能这么做

丰色 发自 凹非寺量子位 | 公众号 QbitAI一提到提高大模型长文本能力,就想到长度外推或者上下文窗口扩展? 不行,这些都太费硬件资源了。 来看一个奇妙新解...
阅读原文

个性经济时代,MiniMax 语音大模型如何 To C?

AI rapper,正式出道。作者丨王 悦 编辑丨陈彩娴 大约一个月前,距离 GPT Store 上线还有两周,一位名为 Kyle Tryon 的国外开发者在个人博客上分享了其基于 C...
阅读原文

小红书开源「InstantID」效果炸裂,被Yann LeCun点赞,迅速蹿上Github热榜

机器之心发布 机器之心编辑部只需一张照片,整个过程无需训练 LoRA 模型,多风格 AI 写真即刻呈现! 最近,有一群来自小红书的 95 后神秘团队,自称 InstantX...
阅读原文

无需人工标注!LLM加持文本嵌入学习:轻松支持100种语言,适配数十万下游任务

新智元报道编辑:LRS 【新智元导读】使用LLM生成海量任务的文本数据,无需人工标注即可大幅提升文本嵌入的适用度,只需1000训练步即可轻松扩展到100种语言。...
阅读原文

重塑3D生成核心理论:VAST、港大、清华用「零」训练数据生成了3D模型

机器之心专栏 机器之心编辑部AI 生成 3D 模型最难的一关,终于被搞定了。无需任何训练数据,只需对着模型描述一句话,如「一个做作业的香蕉人」:或是「一只...
阅读原文

GPT-4不偷懒了!OpenAI连甩五个大模型,价格最低打两折

白交 发自 凹非寺量子位 | 公众号 QbitAIOpenAI深夜更新!一口气连甩五个大模型: 新的GPT-4 Turbo预览模型 新的GPT-3.5 Turbo型号 新的文本审核模型 两种新...
阅读原文

OpenAI官方下场修复GPT-4变懒,上新多个模型、还大降价

机器之心报道 编辑:杜伟、陈萍今天,OpenAI 一口气宣布了 5 个新模型,包括两个文本嵌入模型、升级的 GPT-4 Turbo 预览版和 GPT-3.5 Turbo、一个审核模型。 ...
阅读原文

大模型×文本水印:清华、港中文、港科广、UIC、北邮联合发布首个大模型时代下的文本水印综述

机器之心专栏 机器之心编辑部本文介绍首个大模型时代下的文本水印综述,由清华、港中文、港科广、UIC、北邮联合发布,全面阐述了大模型时代下文本水印技术的...
阅读原文

画个框、输入文字,面包即刻出现:AI开始在3D场景「无中生有」了

机器之心报道 编辑:陈萍现在,通过文本提示和一个 2D 边界框,我们就能在 3D 场景中生成对象。看到下面这张图了没?一开始,盘子里是没有东西的,但当你在托...
阅读原文
1101112131420