标签:模型

ML工程师一次微调7个模型,击败OpenAI GPT-4

新智元报道编辑:好困庸庸 【新智元导读】「微调你的模型,获得比GPT-4更好的性能」不只是说说而已,而是真的可操作。最近,一位愿意动手的ML工程师就把几个...
阅读原文

苹果为什么要用「小模型」?

新智元报道编辑:alan 【新智元导读】WWDC 2024上,苹果推出了Apple Intelligence,向大家展示了如何开发、训练出功能强大、快速且节能的模型,如何根据特定...
阅读原文

大模型性能掺水严重?北大交出答卷:交互评估+动态出题,死记硬背也没用 | ACL 2024

新智元报道编辑:LRS 【新智元导读】当前大语言模型(LLM)的评估方法受到数据污染问题的影响,导致评估结果被高估,无法准确反映模型的真实能力。北京大学等...
阅读原文

爆火AI惨遭,1600万美国年轻人集体「失恋」? Character AI被爆资金断裂,00后炸了

新智元报道编辑:编辑部 【新智元导读】最近,在美国00后中爆火的Character AI,竟然把聊天机器人对话模型给「阉割」了?愤怒的年轻人们冲进社区,抱怨的声浪...
阅读原文

ECCV 2024揭榜,录用率或创新低!2395篇论文中选,网友晒出成绩单

新智元报道编辑:桃子 好困 【新智元导读】两年一届的ECCV录用结果终于揭晓了!刚刚,ECCV组委会公布了录用论文名单,共有2395篇论文被录用。ECCV 2024录用结...
阅读原文

多模态能力全球TOP3,来自中国从容大模型

白交 发自 凹非寺量子位 | 公众号 QbitAI国产多模态大模型的头号交椅,再次易主—— 来自云从科技的从容大模型,登上OpenCompass权威榜单,仅次于GPT-4o、Claud...
阅读原文

鹅厂造10亿虚拟人格专搞数据合成:让7B模型数学成绩打平GPT4,还能给弱智吧出题

克雷西 发自 凹非寺量子位 | 公众号 QbitAI10亿名“员工”生产数据合成,数量占到了世界人口的13%。 不过这些“员工”并不是真人,而是腾讯利用网络数据制造出的...
阅读原文

只需将感知推理能力拆分,2B大模型就能战胜20B!国产新框架高效处理视觉任务

Prism团队 投稿至 凹非寺量子位 | 公众号 QbitAI只要把推理和感知能力拆分,2B大模型就能战胜20B?! 上海AI Lab联合南京大学、香港中文大学等机构,共同推出...
阅读原文

聚焦大模型应用落地,2024全球数字经济大会人工智能专题论坛在京举办

允中 发自 凹非寺量子位 | 公众号 QbitAI7月1日下午,2024全球数字经济大会人工智能专题论坛在中关村国家自主创新示范区会议中心举办。论坛紧扣大模型应用落...
阅读原文

Gen-3开放内测,网友实测demo惊人!魔都时装秀一绝,却依旧不懂物理世界

新智元报道编辑:桃子 【新智元导读】Gen-3 Alpha终于开启测试了!第一时间拿到内测资格的网友们,纷纷放出各种炸裂的demo,看得出Gen-3在生成质量完全跃升。...
阅读原文

力压70B Llama 3,Gemma 2成最强开源模型!大佬质疑用榜单prompt微调引全网热议

新智元报道编辑:乔杨 好困 【新智元导读】导读:时隔4个月上新的Gemma 2模型在LMSYS Chatbot Arena的排行上,以27B的参数击败了许多更大规模的模型,甚至超...
阅读原文

8B尺寸达到GPT-4级性能!北大等提出医疗专家模型训练方法

新智元报道编辑:LRST 【新智元导读】本文研究发现大语言模型在持续预训练过程中出现目标领域性能先下降再上升的现象。本文引入「稳定性差距」概念来解释该现...
阅读原文

谈谈Apple Intelligence边缘推理和大模型隐私的问题

直播预告 | 7月2日10点,「智猩猩AI新青年讲座」第242讲正式开讲,香港大学计算机系HKU-MMLAB二年级博士生梁志烜将直播讲解《利用技能学习的扩散策略实现层次...
阅读原文

和无限光年创始人漆远聊聊:Scaling Law 还有红利,但一定到不了 AGI

一直以来,很多人将 Scaling Law 奉为圭臬,相信用更多数据、更大算力做更大参数的模型,就可以实现 AGI,但聚光灯之外也不乏有一些「少数派」的声音,他们认...
阅读原文

奥特曼热捧华人AI制药公司获3.72亿美元融资;李开复称若AI取代工作,可以代言生发广告;AGI或使全球GDP翻倍丨AI情报局

01 融资快报Formation Bio宣布完成3.72 亿美元D轮融资:Formation Bio(原名为TrialSpark)由华人Benjamine Liu和Linhao Zhang共同创立,是一家专注于将人工...
阅读原文