标签:算子

Physics Reporsts 最新综述:涌现自组织的原理

导语为了理解复杂系统中的自组织和涌现现象,近期,复杂系统和非线性动力学领域的知名学者、美国加州大学戴维斯分校物理系教授 James P. Crutchfield 与合作...
阅读原文

关于AI你最关心什么?技术专家团亲自答(含往期真人纯享版)

允中 发自 凹非寺量子位 | 公众号 QbitAI2022年底,OpenAI的大模型ChatGPT正式问世,并在2023年引领全球“大模型热。 谷歌、微软在内全球科技巨头相继推出各自...
阅读原文

万字综述大模型高效推理:无问芯穹与清华、上交最新联合研究全面解析大模型推理优化

机器之心发布 作者:宁雪妃、周紫轩(无问芯穹TechView)近年来,大语言模型(Large Language Models, LLMs)受到学术界和工业界的广泛关注,得益于其在各种...
阅读原文

偏微分方程有了基础模型:样本需求数量级减少,14项任务表现最佳

机器之心报道 编辑:陈萍本文提出的 Poseidon 在样本效率和准确率方面都表现出色。偏微分方程(PDEs)被称为物理学的语言,因为它们可以在广泛的时间 - 空间...
阅读原文

AI辅助内部研发效率提升,昇腾大模型推理的最佳实践

演讲嘉宾 | 王建辉 以大模型为代表的 AI 技术高速发展,目前 Scaling Law 依然生效,模型参数持续增大,序列不断增长,响应速度越来越快,但大模型商业闭环依...
阅读原文

腾讯PCG自研高性能大语言模型推理引擎「一念LLM」正式开源

AIxiv专栏是机器之心发布学术、技术内容的栏目。过去数年,机器之心AIxiv专栏接收报道了2000多篇内容,覆盖全球各大高校与企业的顶级实验室,有效促进了学术...
阅读原文

大模型国产化适配1-华为昇腾AI全栈软硬件平台总结

直播预告 | 明晚七点,阿里巴巴和NVIDIA的两位专家将直播讲解阿里安全大模型工程实践、NVIDIA NIM 推理微服务解析,欢迎扫码报名~随着 ChatGPT 的现象级走红...
阅读原文

KAN网络技术最全解析——最热KAN能否干掉MLP和Transformer?

导读本文来自知乎,已获授权,作者为陈巍博士。本文对KAN网络进行了深入解析,涉及KAN网络的基本思路、架构与缩放、可解释性。 陈巍博士,千芯科技董事长,曾...
阅读原文

不牺牲算法,不挑剔芯片,这个来自中科院的团队正在加速国产AI芯片破局

机器之心原创 作者:泽南、张倩不降低大模型算法精度,还能把芯片的算力利用效率提升 2~10 倍,这就是编译器的魅力。 在《沙丘》构建的未来世界里,「得香料...
阅读原文

Hyena成下一代Transformer?StripedHyena-7B开源:最高128k输入,训练速度提升50%

新智元报道编辑:LRS 【新智元导读】Hyena处理长序列输入比FlashAttention速度高100倍!最新发布的StripedHyena模型可能成下一代AI架构的新标准?最近几年发...
阅读原文

智源扔出大模型“全家桶”!推最强开源中英双语LLM,赶超Llama 2

智源推最强开源中英双语大模型!340亿参数超越Llama 2-70B。编辑|luna智东西10月12日报道,今日,智源研究院宣布悟道·天鹰Aquila大语言模型系列全面升级到Aqu...
阅读原文

国产大模型开源一哥再登场,最强双语LLM「全家桶」级开源!340亿参数超越Llama2-70B

新智元报道编辑:编辑部【新智元导读】就在刚刚,340亿参数的国产大模型悟道·天鹰Aquila2强势冲上榜首,成为最强开源中英双语大模型。更YYDS的是,这次智源不...
阅读原文

基于牛顿求根法,新算法实现并行训练和评估RNN,带来超10倍增速

机器之心报道编辑:Panda W人们普遍认为 RNN 是无法并行化的,因为其本质上的序列特性:其状态依赖于前一状态。这使得人们难以用长序列来训练 RNN。近日,一...
阅读原文

清华、微软等淘汰提示工程师?LLM与进化算法结合,创造超强提示优化器

新智元报道编辑:润 Lumina【新智元导读】提示工程可以自动化了?EvoPrompt的出现解决了大型语言模型性能依赖高质量提示的挑战,同时展示了LLM在传统算法中的...
阅读原文

700亿参数Llama 2训练加速195%!训练/微调/推理全流程方案开源,0代码一站解决

夕小瑶科技说 分享来源 | 新智元近日,全球规模最大的大模型开发工具与社区Colossal-AI,发布了全套Llama 2训练、微调、推理方案,可以为700亿参数模型的训练...
阅读原文
12