模型 - 第 74 页

GPT5训练失败的思考

原文：https://zhuanlan.zhihu.com/p/718513570 近期硅谷VC、ai创始人交流要点：scaling law或已放缓1、大模型：AI仍是硅谷唯一的话题，但是没有去年那么狂...

阅读原文

AIGC动态

2年前 (2024)

CVPR'24 Navsim挑战赛冠军方案！NVIDIA Hydra-MDP：端到端自动驾驶规划新范式 | 公开课预告

端到端自动驾驶目前逐渐被认为是实现完全自动驾驶的最优解，受到了学术界和产业界的广泛关注。然而，最近的研究表明，近年来涌现的不少端到端自动驾驶模型，...

阅读原文

AIGC动态

2年前 (2024)

DeepMind新成果被批像广告？AlphaProteo可高效设计靶蛋白结合物，亲和力提高300倍

作者：李姝，十九，李宝珠编辑：三羊 DeepMind 发布用于新型蛋白质设计的 AlphaProteo，只需要通过一轮中等通量筛选，无需进一步优化，即可为许多研究应用生...

阅读原文

AIGC动态

2年前 (2024)

一键部署Phi 3.5 mini+vision！多模态阅读基准数据集MRR-Benchmark上线，含550个问答对

‍‍小模型又又又卷起来了！微软开源三连发！一口气发布了 Phi 3.5 针对不同任务的 3 个模型，并在多个基准上超越了其他同类模型。其中 Phi-3.5-mini-instruct...

阅读原文

AIGC动态

2年前 (2024)

开源大模型新王干翻GPT-4o，新技术可纠正自己幻觉，数学99.2分刷爆测试集

西风发自凹非寺量子位 | 公众号 QbitAI开源大模型王座突然易主，居然来自一家小创业团队，瞬间引爆业界。新模型名为Reflection 70B，使用一种全新训练技术...

阅读原文

AIGC动态

2年前 (2024)

谁家大模型，敢 1 个月收 2000 美元啊？！

整理｜冬梅、核子可乐近日，据多家外媒消息，OpenAI 正在考虑为其下一代 AI 模型提供高价订阅服务。这些模型可能包括即将推出的代号为 Strawberry 的“推理...

阅读原文

AIGC动态

2年前 (2024)

2024 上半年 AI 外呼 3 亿次，平安银行数字化驱动降本增效

△点击上方卡片关注我，回复“实践”，即可获得 AI Agent、RAG、多模态大模型相关的案例资料作者 | 罗燕珊平安银行近日发布 2024 年上半年财报，财报显示，受...

阅读原文

AIGC动态

2年前 (2024)

4B小模型掀翻大模型牌桌！性能超GPT-3.5，无限长文本性能超Kimi…

杀疯了！杀疯了！你敢相信 4B 参数小模型，性能却超越千亿量级的 GPT-3.5 ！ OpenAI、谷歌、微软、苹果等一众海内外巨头还没做到的事，被一家中国大模型公司...

阅读原文

AIGC动态

2年前 (2024)

ECCV 2024 | 比基准高30%，媲美Gemini 1.5 Pro，基于记忆的视频理解智能体来了

AIxiv专栏是机器之心发布学术、技术内容的栏目。过去数年，机器之心AIxiv专栏接收报道了2000多篇内容，覆盖全球各大高校与企业的顶级实验室，有效促进了学术...

阅读原文

AIGC动态

2年前 (2024)

支付宝突然推出新App，竟想用AI让日常生活开挂

机器之心原创作者：吴昕只是装了一个 App，整个生活就 AI 了。家人们，支付宝已经这么「炸场」了吗？输入「买一张周日的高铁票，从北京到武汉，下午出发...

阅读原文

AIGC动态

2年前 (2024)

北大领衔，多智能体强化学习研究登上Nature子刊

AIxiv专栏是机器之心发布学术、技术内容的栏目。过去数年，机器之心AIxiv专栏接收报道了2000多篇内容，覆盖全球各大高校与企业的顶级实验室，有效促进了学术...

阅读原文

AIGC动态

2年前 (2024)

端侧ChatGPT时刻！这家清华系大模型公司赶在OpenAI、苹果之前

下周苹果即将召开发布会了！但最令笔者期待的不是 iphone16，而是苹果今年提出的 Apple Intelligence 的进展，这是苹果今年进军端侧 AI 的一大杀手锏。其实...

阅读原文

AIGC动态

2年前 (2024)

智谱完成数十亿元融资，国资再入局；成立不到三个月融资 10 亿美元，Ilya 新公司估值 50 亿美元丨AI情报局

01 今日融资快报智谱完成数十亿元融资，投前估值达200亿元，国资再入局中国大模型独角兽智谱以200亿元的投前估值，完成了新一轮融资，金额达数十亿元。本轮...

阅读原文

AIGC动态

2年前 (2024)

大模型对 AI Infra 的重构之：LLMOps

4-5年前投资人对 AI 的投资热情刚刚褪去不久，大模型就在资本寒冬再次掀起了投资人的热情，这次有什么不同？大模型，投资人看到多，却出手的少，好像将 4-5 ...

阅读原文

AIGC动态

2年前 (2024)

如何估计LLM推理和训练所需的GPU内存？

导读文章转载自知乎，作者为孙鹏飞，本文整理了一份训练或推理需要显存的计算方式。原文地址：https://zhuanlan.zhihu.com/p/716317173 本文只做学术/技术分...

阅读原文

AIGC动态

2年前 (2024)

标签：模型