标签:框架

【万字长文】模型推理服务工具综述

文章转载自公众号:吃果冻不吐果冻皮,本文只做学术/技术分享,如有侵权,联系删文。 摘要: 模型服务是构建机器学习产品的重要步骤。它包括打包模型、构建 A...
阅读原文

端到端优化所有能力,字节跳动提出强化学习LLM Agent框架AGILE

AIxiv专栏是机器之心发布学术、技术内容的栏目。过去数年,机器之心AIxiv专栏接收报道了2000多篇内容,覆盖全球各大高校与企业的顶级实验室,有效促进了学术...
阅读原文

形式化定理证明新突破:SubgoalXL框架让大模型在Isabelle中性能暴涨

AIxiv专栏是机器之心发布学术、技术内容的栏目。过去数年,机器之心AIxiv专栏接收报道了2000多篇内容,覆盖全球各大高校与企业的顶级实验室,有效促进了学术...
阅读原文

自动化机器学习研究MLR-Copilot:利用大型语言模型进行研究加速

AIxiv专栏是机器之心发布学术、技术内容的栏目。过去数年,机器之心AIxiv专栏接收报道了2000多篇内容,覆盖全球各大高校与企业的顶级实验室,有效促进了学术...
阅读原文

24年对于大模型演进方向的一些思考

导读文章转载自知乎,作者为霸王手枪腿,总结了关于大模型计算方式如何变革的一些思路。 原文地址:https://zhuanlan.zhihu.com/p/682434451 本文只做学术/技...
阅读原文

硅基向左,潞晨向右

它们都在努力打破市场的认知天花板。作者 | 朱可轩 编辑 | 陈彩娴 如果将大模型应用开发比做“淘金”,那么构建大模型基座所必需的算力和工具体系,则是不可或...
阅读原文

FP8 低精度训练:Transformer Engine 简析

大模型时代最火AI芯片峰会来啦!!9月6-7日,由智猩猩联合主办的2024全球AI芯片峰会将在北京举行。峰会设有数据中心AI芯片、智算集群技术论坛等7大板块。目前...
阅读原文

阿里推出AI数据科学家,全流程自动化,科研小白也能用

魔搭社区 投稿量子位 | 公众号 QbitAI基于开源Agent框架,可自动解决复杂数据科学问题的Agent来了! 具体来说,Data Science Assistant(以下称DS Assistant...
阅读原文

电脑平板组AI集群,在家就能跑400B大模型,GitHub狂揽2.5K星​

克雷西 发自 凹非寺量子位 | 公众号 QbitAI不用H100,三台苹果电脑就能带动400B大模型。 背后的功臣,是GitHub上的一个开源分布式AI推理框架,已经斩获了2.5k...
阅读原文

可「自主进化」的Agent?首个端到端智能体符号化训练框架开源了

AIxiv专栏是机器之心发布学术、技术内容的栏目。过去数年,机器之心AIxiv专栏接收报道了2000多篇内容,覆盖全球各大高校与企业的顶级实验室,有效促进了学术...
阅读原文

多篇顶会成果!多人互动中的人体动作与反应生成 | 上海交大徐良博士讲座预告

「智猩猩AI新青年讲座」由智猩猩出品,致力于邀请青年学者,主讲他们在生成式AI、LLM、AI Agent、CV等人工智能领域的最新重要研究成果。 AI新青年是加速人工...
阅读原文

谈谈Apple Intelligence边缘推理和大模型隐私的问题

直播预告 | 7月2日10点,「智猩猩AI新青年讲座」第242讲正式开讲,香港大学计算机系HKU-MMLAB二年级博士生梁志烜将直播讲解《利用技能学习的扩散策略实现层次...
阅读原文

具身智能体的异构协同清华大学与北京邮电大学最新研究成果:随遇协同与人机协同

来源:机器人大讲堂 在具身智能领域,多智能体协同已逐渐成为学术界与工业界研究的焦点。与同构机器人相比,异构多智能体协同强调具有不同能力、形态的异构智...
阅读原文

LangChain居然不香了?一线程序员现身说法,硬核博文剖析LLM应用开发原则

新智元报道编辑:乔杨 【新智元导读】最近,Hacker News热榜上出现了一篇「声讨」LangChain的技术文章,得到了评论区网友的一致呼应。去年还火遍LLM圈的LangC...
阅读原文

「大模型」检测「大模型」缺陷,从错误中高效学习

来源:内容来自:GLM 技术团队 第一个在通用任务上系统探索 LLM 缺陷发掘过程的框架。大语言模型(LLM)的一丝缺陷,可能会直接导致实际部署生产中的严重隐患...
阅读原文
12347