标签:模型

法律ChatLaw、金融度小满轩辕大模型实战课程来袭!专家教你搭建 AI 原生应用,更有百度智能云千帆 SDK 加速应用创新

百度智能云千帆大模型平台官方出品的《大模型应用实践》实训营本周正式进入第三周最终阶段!在首周学习了百度智能云千帆大模型平台,第二周深入了解了一些大...
阅读原文

首个全面开源的千亿模型来了!源2.0全家桶击破算力限制,代码数学强到发指

新智元报道编辑:编辑部【新智元导读】昨天,浪潮信息发布源2.0基础大模型,并一口气开源了1026亿、518亿、21亿三个大模型!而在编程、推理、逻辑这些老大难...
阅读原文

Hugging Face CEO预测:2024年AI行业六大巨变!

新智元报道编辑:润【新智元导读】Hugging Face CEO预测2024年,AI行业将出现6大变化,第一条就绷不住了:Hugging Face将破产?2024年,AI行业将会进化成什么...
阅读原文

一个提示,让Llama 2准确率飙至80.3%?Meta提出全新注意力机制S2A,大幅降低模型幻觉

新智元报道编辑:alan【新智元导读】大语言模型「拍马屁」的问题到底要怎么解决?最近,LeCun转发了Meta发布的一篇论文,研究人员提出了新的方法,有效提升了...
阅读原文

简化版Transformer来了,网友:年度论文

机器之心报道机器之心编辑部从大模型的根源开始优化。Transformer 架构可以说是近期深度学习领域许多成功案例背后的主力军。构建深度 Transformer 架构的一种...
阅读原文

胡渊鸣全新创业项目Meshy曝光:一句话生成3D游戏资产,仅需一分钟

机器之能报道编辑:吴昕它会是3D AIGC领域的Midjourney 吗?游戏、电影和 XR 行业对 3D 模型的需求正在激增。尤其是当苹果 Vision Pro、Quest 3 等硬件出货量...
阅读原文

规模小、效率高:DeepMind推出多模态解决方案Mirasol 3B

机器之心报道机器之心编辑部性能优于规模更大的模型。多模态学习面临的主要挑战之一是需要融合文本、音频、视频等异构的模态,多模态模型需要组合不同来源的...
阅读原文

腾讯披露最新大模型训练方法:效率提升至 2.6 倍、可节省 50% 算力成本

作者 | 褚杏娟 如今,大模型的参数规模呈现指数级增长。在算力紧缺的背景下,如何提升大模型训练和推理的效率,并降低成本,成为业界关注的焦点。11 月 23 日...
阅读原文

又一千亿级大模型问世,全面开源!

夕小瑶科技说 分享11月27日,浪潮信息发布“源2.0”基础大模型,并宣布全面开源。源2.0基础大模型包括1026亿、518亿、21亿等三种参数规模的模型,在编程、推理...
阅读原文

大语言模型成为了「调包侠」?耶鲁提出代码生成新基准:ML-Bench

夕小瑶科技说 原创作者| 夕小瑶编辑部更实际,更有用的代码生成评测方案来了!ML-Bench提出了新的代码生成Benchmark,其目标在于评测大模型如何利用开源仓库...
阅读原文

仅靠合成数据无法实现 AGI

点击上方蓝字关注我们“ OpenAI最新的模型Q*引发了关注,它能解决数学问题并展现出卓越的推理能力。然而,是否应该依赖合成数据引发了科技社区的讨论,有人认...
阅读原文

传字节成立AI应用新部门Flow;淘天集团筹建大模型团队;浪潮信息开源千亿级大模型丨AIGC大事日报

11/27全球AIGC产业要闻1、传字节跳动成立新部门Flow 发力AI应用层2、传淘天集团筹建大模型团队3、浪潮信息发布千亿级开源大模型源2.04、马毅团队提出白盒Tran...
阅读原文

硅谷疯狂的一周,OpenAI 宫斗最大的赢家不是 Altman

机会留给有准备的人OpenAI 宫斗第一季落幕,微软有惊无险地得到了最理想的结果。微软 CEO 纳德拉一开始只是观众,提前几分钟知道了 Altman 被开除的消息,但...
阅读原文

大模型入局,操作系统下半场到达关键点

来源:CSDN(ID:CSDNnews)作者:何苗 近日,第十三届深度开发者与用户大会(DDUC)在北京召开。这是deepin(深度)社区一年一度最盛大的社区活动,吸引了...
阅读原文

法国人工智能实验室 Kyutai 获得 3.3 亿美元投资,押注于开源

点击上方蓝字关注我们“ Kyutai实验室,由法国亿万富翁资助,旨在开源人工智能研究,总预算3.3亿美元,得到法国总统支持。他们将所有研究模型开源,成为全球研...
阅读原文