标签:框架

24年对于大模型演进方向的一些思考

导读文章转载自知乎,作者为霸王手枪腿,总结了关于大模型计算方式如何变革的一些思路。 原文地址:https://zhuanlan.zhihu.com/p/682434451 本文只做学术/技...
阅读原文

硅基向左,潞晨向右

它们都在努力打破市场的认知天花板。作者 | 朱可轩 编辑 | 陈彩娴 如果将大模型应用开发比做“淘金”,那么构建大模型基座所必需的算力和工具体系,则是不可或...
阅读原文

FP8 低精度训练:Transformer Engine 简析

大模型时代最火AI芯片峰会来啦!!9月6-7日,由智猩猩联合主办的2024全球AI芯片峰会将在北京举行。峰会设有数据中心AI芯片、智算集群技术论坛等7大板块。目前...
阅读原文

阿里推出AI数据科学家,全流程自动化,科研小白也能用

魔搭社区 投稿量子位 | 公众号 QbitAI基于开源Agent框架,可自动解决复杂数据科学问题的Agent来了! 具体来说,Data Science Assistant(以下称DS Assistant...
阅读原文

电脑平板组AI集群,在家就能跑400B大模型,GitHub狂揽2.5K星​

克雷西 发自 凹非寺量子位 | 公众号 QbitAI不用H100,三台苹果电脑就能带动400B大模型。 背后的功臣,是GitHub上的一个开源分布式AI推理框架,已经斩获了2.5k...
阅读原文

可「自主进化」的Agent?首个端到端智能体符号化训练框架开源了

AIxiv专栏是机器之心发布学术、技术内容的栏目。过去数年,机器之心AIxiv专栏接收报道了2000多篇内容,覆盖全球各大高校与企业的顶级实验室,有效促进了学术...
阅读原文

多篇顶会成果!多人互动中的人体动作与反应生成 | 上海交大徐良博士讲座预告

「智猩猩AI新青年讲座」由智猩猩出品,致力于邀请青年学者,主讲他们在生成式AI、LLM、AI Agent、CV等人工智能领域的最新重要研究成果。 AI新青年是加速人工...
阅读原文

谈谈Apple Intelligence边缘推理和大模型隐私的问题

直播预告 | 7月2日10点,「智猩猩AI新青年讲座」第242讲正式开讲,香港大学计算机系HKU-MMLAB二年级博士生梁志烜将直播讲解《利用技能学习的扩散策略实现层次...
阅读原文

具身智能体的异构协同清华大学与北京邮电大学最新研究成果:随遇协同与人机协同

来源:机器人大讲堂 在具身智能领域,多智能体协同已逐渐成为学术界与工业界研究的焦点。与同构机器人相比,异构多智能体协同强调具有不同能力、形态的异构智...
阅读原文

LangChain居然不香了?一线程序员现身说法,硬核博文剖析LLM应用开发原则

新智元报道编辑:乔杨 【新智元导读】最近,Hacker News热榜上出现了一篇「声讨」LangChain的技术文章,得到了评论区网友的一致呼应。去年还火遍LLM圈的LangC...
阅读原文

「大模型」检测「大模型」缺陷,从错误中高效学习

来源:内容来自:GLM 技术团队 第一个在通用任务上系统探索 LLM 缺陷发掘过程的框架。大语言模型(LLM)的一丝缺陷,可能会直接导致实际部署生产中的严重隐患...
阅读原文

为什么都放弃了LangChain?

机器之心报道 机器之心编辑部或许从诞生那天起,LangChain 就注定是一个口碑两极分化的产品。 看好 LangChain 的人欣赏它丰富的工具和组建和易于集成等特点,...
阅读原文

答案抽取正确率达96.88%,xFinder断了大模型「作弊」的小心思

AIxiv专栏是机器之心发布学术、技术内容的栏目。过去数年,机器之心AIxiv专栏接收报道了2000多篇内容,覆盖全球各大高校与企业的顶级实验室,有效促进了学术...
阅读原文

英伟达开源合成数据大模型:奖励模型,超过GPT-4 Turbo

直播预告 | 6月18日上午10点,「智猩猩AI新青年讲座」第240讲正式开讲,邀请到德州大学奥斯汀分校刘星超博士将直播讲解《利用直线概率流加速Stable Diffusion...
阅读原文

SIGGRAPH2024|上科大、影眸联合提出DressCode:从文本生成3D服装板片

AIxiv专栏是机器之心发布学术、技术内容的栏目。过去数年,机器之心AIxiv专栏接收报道了2000多篇内容,覆盖全球各大高校与企业的顶级实验室,有效促进了学术...
阅读原文
1235