标签:模型

2024年,开源AI潜力更大?

选自synaptic 机器之心编译 机器之心编辑部‍开源社区为人工智能发展做了什么? 开源(OS)正在驱动生成式 AI 的创新。得益于像 GitHub 和 Hugging Face 等学...
阅读原文

视觉Mamba模型的Swin时刻,中国科学院、华为等推出VMamba

机器之心专栏 机器之心编辑部Transformer 在大模型领域的地位可谓是难以撼动。不过,这个AI 大模型的主流架构在模型规模的扩展和需要处理的序列变长后,局限...
阅读原文

零一万物Yi-VL多模态大模型开源,MMMU、CMMMU两大权威榜单领先

机器之心发布 机器之心编辑部1 月 22 日,零一万物 Yi 系列模型家族迎来新成员:Yi Vision Language(Yi-VL)多模态语言大模型正式面向全球开源。据悉,Yi-VL...
阅读原文

AI 筛选电池材料,广州大学叶思宇院士开发可用于 P-SOC 材料预测的机器学习算法模型

作者:田小幺 编辑:李宝珠,三羊 封面图来源:摄图网 广州大学的研究人员建立了一种基于极限梯度增强 (XGBoost) 算法的机器学习模型,可用于 P-SOC 空气电极...
阅读原文

每周编辑精选|RJUA-QA 医疗数据集上线、 3D 分子生成模型 ResGen 论文解析

HyperAI超神经的新栏目来啦~每周一超神经编辑部会精选上一周更新在hyper.ai官网的内容(数据集、AI4S 论文案例、百科词条)发布在这里。欢迎直接访问hyper.a...
阅读原文

大模型训练loss突刺原因和解决办法

直播预告 | 今晚7点,「自动驾驶新青年讲座」第35讲正式开讲,LMDrive一作、香港中文大学MMLab在读博士邵昊将主讲《LMDrive:大语言模型加持的闭环端到端自动...
阅读原文

傅盛揭穿OpenAI「阳谋」,引130万人围观!百亿参数模型帮老板打王者,一张3060就能跑

新智元报道编辑:编辑部 【新智元导读】就在刚刚,OpenAI的最大秘密,被傅盛在130万人面前揭穿!百亿参数,竟能在企业级应用中媲美千亿级大模型;一张3060,...
阅读原文

Llama 2打败GPT-4!Meta让大模型自我奖励自迭代,再证合成数据是LLM终局

新智元报道编辑:桃子 润 【新智元导读】AI训AI必将成为一大趋势。Meta和NYU团队提出让大模型「自我奖励」的方法,让Llama2一举击败GPT-4 0613、Claude 2、Ge...
阅读原文

五位清华教授团建!从复杂推理到算力瓶颈,他们眼中“通用人工智能” 该如何降临?

来源:圆桌内容来自智谱 AI 技术开放日 圆桌嘉宾 清华大学计算机系教授 黄民烈 清华大学电子工程系教授 汪玉 清华大学计算机系教授 翟季冬 清华大学计算机系...
阅读原文

网易开启大规模裁员;谷歌中国工程师命案与裁员无关;字节跳动18薪变15薪;阿里云山寨“通义千问”索赔23万胜诉 | AI周报

作者 | 鞠昕洁 网易开启大规模裁员,涉及网易传媒、游戏等业务;字节跳动薪酬再调整:18 薪变 15 薪,月基础薪资提升 20%;Meta:正在训练 Llama 3,今年要砸...
阅读原文

Stability AI杀回来了:视频生成新Demo效果惊人,网友:一致性超群

白交 衡宇 发自 凹非寺量子位 | 公众号 QbitAIStable Diffusion要王者归来了? Stability AI CEO Emad Mostaque最新推文,四段视频引人无数遐想。 不少网友怀...
阅读原文

英伟达新对话QA模型准确度超GPT-4,却遭吐槽:无权重代码意义不大

机器之心报道 编辑:大盘鸡、杜伟昨天,Meta、纽约大学的研究者用「自我奖励方法」,让大模型自己生成自己的微调数据,从而在 Llama 2 70B 的迭代微调后超越...
阅读原文

Pika、Gen-2、ModelScope、SEINE……AI视频生成哪家强?这个框架一测便知

机器之心专栏 机器之心编辑部AI 视频生成,是最近最热门的领域之一。各个高校实验室、互联网巨头 AI Lab、创业公司纷纷加入了 AI 视频生成的赛道。Pika、Gen-...
阅读原文

普林斯顿博士生高天宇指令微调进展速览:数据、算法和评估

选自gaotianyu.xyz/blog 作者:高天宇 机器之心编译 编辑:Panda自 ChatGPT 等大型语言模型推出以来,为了提升模型效果,各种指令微调方法陆续被提出。本文中...
阅读原文

大模型笔记!以LLAMA为例,快速入门LLM的推理过程

直播预告 | 下周一晚7点,「自动驾驶新青年讲座」第35讲正式开讲,LMDrive一作、香港中文大学MMLab在读博士邵昊将主讲《LMDrive:大语言模型加持的闭环端到端...
阅读原文