标签:模型

GPT5训练失败的思考

原文:https://zhuanlan.zhihu.com/p/718513570 近期硅谷VC、ai创始人交流要点:scaling law或已放缓1、 大模型:AI仍是硅谷唯一的话题,但是没有去年那么狂...
阅读原文

CVPR'24 Navsim挑战赛冠军方案!NVIDIA Hydra-MDP:端到端自动驾驶规划新范式 | 公开课预告

端到端自动驾驶目前逐渐被认为是实现完全自动驾驶的最优解,受到了学术界和产业界的广泛关注。然而,最近的研究表明,近年来涌现的不少端到端自动驾驶模型,...
阅读原文

DeepMind新成果被批像广告?AlphaProteo可高效设计靶蛋白结合物,亲和力提高300倍

作者:李姝,十九,李宝珠 编辑:三羊 DeepMind 发布用于新型蛋白质设计的 AlphaProteo,只需要通过一轮中等通量筛选,无需进一步优化,即可为许多研究应用生...
阅读原文

一键部署Phi 3.5 mini+vision!多模态阅读基准数据集MRR-Benchmark上线,含550个问答对

‍‍小模型又又又卷起来了!微软开源三连发!一口气发布了 Phi 3.5 针对不同任务的 3 个模型,并在多个基准上超越了其他同类模型。 其中 Phi-3.5-mini-instruct...
阅读原文

开源大模型新王干翻GPT-4o,新技术可纠正自己幻觉,数学99.2分刷爆测试集

西风 发自 凹非寺量子位 | 公众号 QbitAI开源大模型王座突然易主,居然来自一家小创业团队,瞬间引爆业界。 新模型名为Reflection 70B,使用一种全新训练技术...
阅读原文

谁家大模型,敢 1 个月收 2000 美元啊?!

整理|冬梅、核子可乐 近日,据多家外媒消息,OpenAI 正在考虑为其下一代 AI 模型提供高价订阅服务。这些模型可能包括即将推出的代号为 Strawberry 的“推理...
阅读原文

2024 上半年 AI 外呼 3 亿次,平安银行数字化驱动降本增效

△点击上方卡片关注我,回复“实践”,即可获得 AI Agent、RAG、多模态大模型相关的案例资料 作者 | 罗燕珊 平安银行近日发布 2024 年上半年财报,财报显示,受...
阅读原文

4B小模型掀翻大模型牌桌!性能超GPT-3.5,无限长文本性能超Kimi…

杀疯了!杀疯了! 你敢相信 4B 参数小模型,性能却超越千亿量级的 GPT-3.5 ! OpenAI、谷歌、微软、苹果等一众海内外巨头还没做到的事,被一家中国大模型公司...
阅读原文

支付宝突然推出新App,竟想用AI让日常生活开挂

机器之心原创 作者:吴昕只是装了一个 App,整个生活就 AI 了 。家人们,支付宝已经这么「炸场」了吗? 输入「买一张周日的高铁票,从北京到武汉, 下午出发...
阅读原文

北大领衔,多智能体强化学习研究登上Nature子刊

AIxiv专栏是机器之心发布学术、技术内容的栏目。过去数年,机器之心AIxiv专栏接收报道了2000多篇内容,覆盖全球各大高校与企业的顶级实验室,有效促进了学术...
阅读原文

ECCV 2024 | 比基准高30%,媲美Gemini 1.5 Pro,基于记忆的视频理解智能体来了

AIxiv专栏是机器之心发布学术、技术内容的栏目。过去数年,机器之心AIxiv专栏接收报道了2000多篇内容,覆盖全球各大高校与企业的顶级实验室,有效促进了学术...
阅读原文

端侧ChatGPT时刻!这家清华系大模型公司赶在OpenAI、苹果之前

下周苹果即将召开发布会了! 但最令笔者期待的不是 iphone16,而是苹果今年提出的 Apple Intelligence 的进展,这是苹果今年进军端侧 AI 的一大杀手锏。 其实...
阅读原文

智谱完成数十亿元融资,国资再入局;成立不到三个月融资 10 亿美元,Ilya 新公司估值 50 亿美元丨AI情报局

01 今日融资快报智谱完成数十亿元融资,投前估值达200亿元,国资再入局 中国大模型独角兽智谱以200亿元的投前估值,完成了新一轮融资,金额达数十亿元。本轮...
阅读原文

大模型对 AI Infra 的重构之:LLMOps

4-5年前投资人对 AI 的投资热情刚刚褪去不久,大模型就在资本寒冬再次掀起了投资人的热情,这次有什么不同?大模型,投资人看到多,却出手的少,好像将 4-5 ...
阅读原文

如何估计LLM推理和训练所需的GPU内存?

导读文章转载自知乎,作者为孙鹏飞,本文整理了一份训练或推理需要显存的计算方式。 原文地址:https://zhuanlan.zhihu.com/p/716317173 本文只做学术/技术分...
阅读原文
17273747576483