标签:模型

1块3090就能训7B大模型,山东大学低带宽低显存训练法,解决显卡限购卡脖子

夕小瑶科技说 原创作者 | 谢年年 大模型的全参数微调对资源要求非常高,当前业界更倾向于采用LoRA,Parallel Adapter等参数高效微调(PEFT)方法,通过添加只...
阅读原文

ACL2024:浙江大学提出大小模型协同的跨文档理解,低成本高表现

夕小瑶科技说 原创作者 | Richard 自大模型出现以来,其在自然语言处理领域取得了令人瞩目的进展。然而如何有效地将大模型应用于具体的任务中,仍面临诸多挑...
阅读原文

王兴兴、王鹤、卢宗青、邵林、高阳等专家共论具身前沿

大数据文摘受权转载自智源社区 从Figure01和人类交流自如、特斯拉Optimus叠衬衫,以及宇树G1惊艳发布,再到公众对人形机器人的争相追逐可以看出,具身智能是2...
阅读原文

如何快速掌握 Prompt 核心技巧与 GPT 技术理论? | 极客时间

AI 浪潮来袭后,媒体上每天层出不穷的「重磅」「震惊」新闻,每一个接触到 AI 的小伙伴都有深切的感受: 1、震惊于AI的能力 2、震惊于AI的发展速度 3、被爆炸...
阅读原文

Runway 全新 Gen-3 视频生成模型获网友盛赞:比 Sora 更好

编译 | 核子可乐 褚杏娟 凭借广受欢迎的视频生成工具而声名大噪的 AI 厂商 Runway 最近发布了最新版本的 Runway Gen-3。Gen-3 Alpha 是 Runway 在专为大规模...
阅读原文

AI教育“智”变大考,小度率先交卷了

允中 发自 凹非寺量子位 | 公众号 QbitAI作为继OpenAI、微软、谷歌后,最后一个万众期待的尖子生,苹果在上周举行的WWDC24全球开发者大会上,终于交出了自己...
阅读原文

商汤披露:50篇论文入选CVPR 2024

一水 发自 凹非寺量子位 | 公众号 QbitAICVPR正在进行中,中国科研力量再次成为场内外焦点之一。 日前,AI顶会常客选手商汤科技,已经披露了今年成绩单:50篇...
阅读原文

340B险胜70B,Kimi机器人贴脸“嘲讽”英伟达新开源模型

一水 发自 凹非寺量子位 | 公众号 QbitAI排名超过Llama-3-70B,英伟达Nemotron-4 340B问鼎竞技场最强开源模型! 前两天,英伟达突然开源了其通用大模型Nemotr...
阅读原文

AI生图可“量身定制”了,华为&清华联手打造个性化多模态生成方法PMG

星海 投稿量子位 | 公众号 QbitAI苹果OpenAI官宣合作,GPT-4o加持Siri,让AI个性化生成赛道热度飙升。 其实,国内已有相关研究,一项基于大模型的个性化多模...
阅读原文

大模型如何数据困局,WAIC产学研专家共话突围之道

AGI 时代,大模型技术为行业带来颠覆式变革。大模型技术的快速迭代离不开海量数据的支撑,高质量专业数据的流动与共享,是促进大模型技术应用加速发展的一个...
阅读原文

吴恩达团队新作:多模态多样本上下文学习,无需微调快速适应新任务

AIxiv专栏是机器之心发布学术、技术内容的栏目。过去数年,机器之心AIxiv专栏接收报道了2000多篇内容,覆盖全球各大高校与企业的顶级实验室,有效促进了学术...
阅读原文

从 CLM 启航:中国大模型的探索与未来

CLM大会不仅是大模型“上半场”的归纳总结,更是拉开了“下半场”中国大模型道路的探索的序幕。作者丨陈鹭伊 编辑丨岑峰 在人工智能的广阔舞台上,大模型技术的崛...
阅读原文

GPT-5或于3个月后发布;英伟达市值成全球第一;AI教父支持超级AI取代人类丨AI情报局

00 情报局独家GPT-5或于3个月后发布:AI情报局接获线报,据OpenAI内部消息,GPT-5最快将于3个月后发布,因为OpenAI需要3个月邀请各领域的专家来做内容安全审...
阅读原文

AI大佬重磅预测:高阶模型不会开源,软件公司或消失,「单飞」创业者春天来了

新智元报道编辑:编辑部 【新智元导读】深耕科技的早期投资机构蓝驰创投近期将AGI投资观迭代至2.0版本。一些比较亮眼的观点有:未来,软件公司或将消失,GenA...
阅读原文

可实现5千升工业化生产!全球首款经大模型设计的蛋白质产品正式落地;测评指标超过 GPT4!全国首个自然语言蛋白质大模型开源

AI for Science 企业动态速览—— *全球首款经大模型设计实现 5,000 升工业化生产的蛋白质产品落地 *测评指标超过 GPT4!途深智合宣布开源全国首个自然语言蛋白...
阅读原文