标签:研究者

首批类Sora模型出现,色拉布上线Snap Video,效果优于Pika、不输Gen-2

机器之心报道 编辑:杜伟、蛋酱文生视频这个战场,入局的玩家越来越多了。这次是阅后即焚 SnapChat 背后的公司。 最近,OpenAI 视频生成模型 Sora 的爆火,给...
阅读原文

复旦发布!通过集成小推理引擎,赋能大模型逻辑推理能力

夕小瑶科技说 原创作者 | 芒果、python引言:探索大语言模型的逻辑推理能力在人工智能领域,大语言模型(LLMs)的推理能力一直是研究的热点。这些模型在各种...
阅读原文

端侧最强,Meta田渊栋等人卷10亿以下参数小模型,LeCun:小技巧启动

机器之心报道 机器之心编辑部Meta 推出 MobileLLM 系列,一款适用于移动设备上的「小」模型。「在移动设备上运行 LLM?可能需要 Meta 的一些技巧。」刚刚,图...
阅读原文

大模型Scaling Law同样适用于下游任务性能?斯坦福、谷歌最新研究揭秘

机器之心报道 编辑:蛋酱、张倩大模型的成功很大程度上要归因于 Scaling Law 的存在,这一定律量化了模型性能与训练数据规模、模型架构等设计要素之间的关系...
阅读原文

目标检测新SOTA:YOLOv9问世,新架构让传统卷积重焕生机

机器之心报道 机器之心编辑部在目标检测领域,YOLOv9 实现了一代更比一代强,利用新架构和方法让传统卷积在参数利用率方面胜过了深度卷积。 继 2023 年 1 月 ...
阅读原文

全球最强开源大模型一夜易主!谷歌Gemma 7B碾压Llama 2 13B,今夜重燃开源之战

新智元报道编辑:编辑部 【新智元导读】谷歌发布全球最强开源大模型Gemma,7B性能超越Llama 2 13B!谷歌和OpenAI,已经卷出了新高度。这轮番放深夜炸弹的频率...
阅读原文

出圈的Sora带火DiT,连登GitHub热榜,已进化出新版本SiT

机器之心报道 编辑:杜伟好的研究不会被埋没,只会历久弥新。虽然已经发布近一周时间,OpenAI 视频生成大模型 Sora 的影响仍在继续! 其中,Sora 研发负责人...
阅读原文

后Sora时代,CV从业者如何选择模型?卷积还是ViT,监督学习还是CLIP范式

机器之心报道 编辑:蛋酱如何衡量一个视觉模型?又如何选择适合自己需求的视觉模型?MBZUAI和Meta的研究者给出了答案。一直以来,ImageNet 准确率是评估模型...
阅读原文

让视觉语言模型搞空间推理,谷歌又整新活了

机器之心报道 机器之心编辑部视觉语言模型虽然强大,但缺乏空间推理能力,最近 Google 的新论文说它的 SpatialVLM 可以做,看看他们是怎么做的。视觉语言模型...
阅读原文

OpenAI超级视频模型Sora技术报告解读,虚拟世界涌现了

夕小瑶科技说 分享来源 | 新智元 昨天白天,「现实不存在了」开始全网刷屏。 「我们这么快就步入下一个时代了?Sora简直太炸裂了」。 「这就是电影制作的未来...
阅读原文

一锤降维!解密OpenAI超级视频模型Sora技术报告,虚拟世界涌现了

新智元报道编辑:编辑部 【新智元导读】OpenAI首个AI视频模型Sora横空出世,再次创造历史。这个堪称「世界模型」的技术报告也在今天发布了,不过依然没有公开...
阅读原文

语音生成的「智能涌现」:10万小时数据训练,亚马逊祭出10亿参数BASE TTS

机器之心报道 编辑:蛋酱伴随着生成式深度学习模型的飞速发展,自然语言处理(NLP)和计算机视觉(CV)已经经历了根本性的转变,从有监督训练的专门模型,转...
阅读原文

陪跑又快又稳,机器人跑步搭子来了

机器之心报道 编辑:陈萍、蛋酱这个机器人名叫Cassie,曾经创下百米跑世界纪录。最近,加州大学伯克利分校的研究者给它开发了一种新的深度强化学习算法,让它...
阅读原文

万字长文,大语言模型如何宣告心理学的死亡?

大数据文摘授权转载自追问nextquestion在心理学的历史长河中,我们一直在追求对人类心理的深入理解。我们试图解码思维、情感和行为背后的复杂机制,希望借此...
阅读原文

三年16篇一作,前谷歌研究科学家Yi Tay官宣新模型,21B媲美Gemini Pro、GPT-3.5

机器之心报道 编辑:陈萍该团队的新模型在多个基准测试中都与 Gemini Pro 、GPT-3.5 相媲美。 如果你经常读 AI 大模型方向的论文,Yi Tay 想必是一个熟悉的名...
阅读原文
15678913