标签:研究者
全球最强开源大模型一夜易主!谷歌Gemma 7B碾压Llama 2 13B,今夜重燃开源之战
新智元报道编辑:编辑部 【新智元导读】谷歌发布全球最强开源大模型Gemma,7B性能超越Llama 2 13B!谷歌和OpenAI,已经卷出了新高度。这轮番放深夜炸弹的频率...
出圈的Sora带火DiT,连登GitHub热榜,已进化出新版本SiT
机器之心报道 编辑:杜伟好的研究不会被埋没,只会历久弥新。虽然已经发布近一周时间,OpenAI 视频生成大模型 Sora 的影响仍在继续! 其中,Sora 研发负责人...
后Sora时代,CV从业者如何选择模型?卷积还是ViT,监督学习还是CLIP范式
机器之心报道 编辑:蛋酱如何衡量一个视觉模型?又如何选择适合自己需求的视觉模型?MBZUAI和Meta的研究者给出了答案。一直以来,ImageNet 准确率是评估模型...
让视觉语言模型搞空间推理,谷歌又整新活了
机器之心报道 机器之心编辑部视觉语言模型虽然强大,但缺乏空间推理能力,最近 Google 的新论文说它的 SpatialVLM 可以做,看看他们是怎么做的。视觉语言模型...
OpenAI超级视频模型Sora技术报告解读,虚拟世界涌现了
夕小瑶科技说 分享来源 | 新智元 昨天白天,「现实不存在了」开始全网刷屏。 「我们这么快就步入下一个时代了?Sora简直太炸裂了」。 「这就是电影制作的未来...
一锤降维!解密OpenAI超级视频模型Sora技术报告,虚拟世界涌现了
新智元报道编辑:编辑部 【新智元导读】OpenAI首个AI视频模型Sora横空出世,再次创造历史。这个堪称「世界模型」的技术报告也在今天发布了,不过依然没有公开...
语音生成的「智能涌现」:10万小时数据训练,亚马逊祭出10亿参数BASE TTS
机器之心报道 编辑:蛋酱伴随着生成式深度学习模型的飞速发展,自然语言处理(NLP)和计算机视觉(CV)已经经历了根本性的转变,从有监督训练的专门模型,转...
陪跑又快又稳,机器人跑步搭子来了
机器之心报道 编辑:陈萍、蛋酱这个机器人名叫Cassie,曾经创下百米跑世界纪录。最近,加州大学伯克利分校的研究者给它开发了一种新的深度强化学习算法,让它...
万字长文,大语言模型如何宣告心理学的死亡?
大数据文摘授权转载自追问nextquestion在心理学的历史长河中,我们一直在追求对人类心理的深入理解。我们试图解码思维、情感和行为背后的复杂机制,希望借此...
三年16篇一作,前谷歌研究科学家Yi Tay官宣新模型,21B媲美Gemini Pro、GPT-3.5
机器之心报道 编辑:陈萍该团队的新模型在多个基准测试中都与 Gemini Pro 、GPT-3.5 相媲美。 如果你经常读 AI 大模型方向的论文,Yi Tay 想必是一个熟悉的名...
AI Agent自主设计全新蛋白质登Nature!威斯康星大学让机器人科学家做实验,无需人类帮助
新智元报道编辑:Aeneas 【新智元导读】这个自动化蛋白质设计系统可以自己设计和测试新的蛋白质,不需要人类的帮助。就像一个能自己做实验的机器人科学家。它...
GPT-4/Gemini大翻车,做旅行攻略成功率≈0%!复旦OSU等华人团队:Agent不会复杂任务规划
新智元报道编辑:编辑部 【新智元导读】最近,复旦、俄亥俄州立大学、Meta和宾夕法尼亚州立大学的研究者发现,GPT-4 Agent规划旅行只有0.6%成功率!离在人类...
像人类一样在批评中学习成长,1317条评语让LLaMA2胜率飙升30倍
机器之心专栏 机器之心编辑部除了分数,打出分数背后的理由对于大模型对齐更具价值。现有的大模型对齐方法包括基于示例的监督微调(SFT)和基于分数反馈的强...
年龄两岁,教龄一年半:婴儿AI训练师登上Science
机器之心报道 编辑:娄佳琪、张倩只用 61 个小时的数据:人们终于证明了,利用当代 AI 工具,实现「真正的语言学习」是可行的。 在公开采访中,图灵奖得主 Ya...
万字长文,大语言模型如何宣告心理学的死亡?| 追问观察
▷本文为追问特约长文,信息密度高,阅读需40min。建议收藏或转发朋友圈,分多次阅读,愿有所收获。本文已开快捷转载,如需另外开白,还请留言。本文标题为编...