标签:指令
只需将感知推理能力拆分,2B大模型就能战胜20B!国产新框架高效处理视觉任务
Prism团队 投稿至 凹非寺量子位 | 公众号 QbitAI只要把推理和感知能力拆分,2B大模型就能战胜20B?! 上海AI Lab联合南京大学、香港中文大学等机构,共同推出...
8B尺寸达到GPT-4级性能!北大等提出医疗专家模型训练方法
新智元报道编辑:LRST 【新智元导读】本文研究发现大语言模型在持续预训练过程中出现目标领域性能先下降再上升的现象。本文引入「稳定性差距」概念来解释该现...
OpenAI服务受限?别担心,来这里丝滑玩转700亿参数Llama3,还有100元券免费薅!
新智元报道编辑:编辑部 【新智元导读】如何无痛玩转Llama 3,这个手把手教程一看就会!80亿参数推理单卡半分钟速成,微调700亿参数仅用4卡近半小时训完,还...
《Python 机器学习》作者新作:从头开始构建大型语言模型,代码已开源
机器之心报道 机器之心编辑部自 ChatGPT 发布以来,大型语言模型(LLM)已经成为推动人工智能发展的关键技术。 近期,机器学习和 AI 研究员、畅销书《Python ...
阿里Qwen2大模型微调入门实战(附完整代码)
直播预告 | 6月20日晚7点,「智猩猩机器人新青年讲座」第8讲正式开讲,清华大学THUNLP lab在读博士胡锦毅将直播讲解《面向多模态大模型的具身智能平台LEGENT...
340B险胜70B,Kimi机器人贴脸“嘲讽”英伟达新开源模型
一水 发自 凹非寺量子位 | 公众号 QbitAI排名超过Llama-3-70B,英伟达Nemotron-4 340B问鼎竞技场最强开源模型! 前两天,英伟达突然开源了其通用大模型Nemotr...
北大快手攻克复杂视频生成难题!新框架轻松组合各种细节,代码将开源
杨灵 投稿自 凹非寺量子位 | 公众号 QbitAI如何生成高难度、指令超复杂的视频呢? 北大与快手AI有解了,他们提出新框架VideoTetris,就像拼俄罗斯方块一样,...
英伟达开源3400亿巨兽,98%合成数据训出最强开源通用模型!性能对标GPT-4o
新智元报道编辑:Aeneas 好困 【新智元导读】刚刚,英伟达全新发布的开源模型Nemotron-4 340B,有可能彻底改变训练LLM的方式!从此,或许各行各业都不再需要...
Mobile-Agent-v2问世,自动化手机操作能力再上新台阶
AIxiv专栏是机器之心发布学术、技术内容的栏目。过去数年,机器之心AIxiv专栏接收报道了2000多篇内容,覆盖全球各大高校与企业的顶级实验室,有效促进了学术...
一句话手机自己打车,开源多智能体AI助手,非苹果手机也能玩
Mobile-Agent团队 投稿量子位 | 公众号 QbitAI一句话让AI自动化操作手机,打个车已经不是难事了。 从官方公布的演示视频来看,用户只需要说出目的地,Agent就...
一夜之间,苹果无数AI工具创业公司!GPT-4o深度整合进苹果
大数据文摘授权转载自夕小瑶科技说作者:夕小瑶编辑部 就在刚刚,苹果发布会WWDC2024官宣了一系列AI相关的重磅升级。 由于这一波AI升级攒的太大了,苹果甚至...
苹果下周就要发布的 AI 版 Siri,终极形态或许超出你想象| WWDC24 前瞻
AI Siri 接管应用Siri 已经落后了。 据《纽约报道》,这就是去年苹果软件主管 Craig Federighi 和机器学习高管 John Giannandrea 花了几周测试 ChatGPT 后的...
阿里云重磅发布开源模型Qwen2,性能超Llama3-70及国内众多闭源模型
整理 | 褚杏娟 6月7日,阿里云更新技术博客,并重磅发布开源模型 Qwen2-72B,性能超过美国最强的开源模型 Llama3-70B,也超过文心 4.0、豆包 pro、混元 pro ...
阿里Qwen2正式开源,性能全方位包围Llama-3
机器之心报道 编辑:大盘鸡Qwen 系列会是众多大学实验室新的默认基础模型吗? 斯坦福团队套壳清华大模型的事件不断发酵后,中国模型在世界上开始得到了更多关...
多模态视觉-语言大模型的架构演进
直播预告 | 6月6日晚7点,「智猩猩AI新青年讲座」第238讲正式开讲,香港大学CVMI Lab在读博士 杨霁晗将直播讲解《V-IRL:根植于真实世界的AI Agents》,欢迎...