标签:模型
ChatGPT「秘方」竟在拖LLM后腿?Karpathy、LeCun联手开怼RLHF!
新智元报道编辑:乔杨好困 【新智元导读】RLHF到底是不是强化学习?最近,AI大佬圈因为这个讨论炸锅了。和LeCun同为质疑派的Karpathy表示:比起那种让AlphaGo...
CMU教授、机器学习系主任空降OpenAI董事会,曾用一句话攻破ChatGPT
新智元报道编辑:耳朵 好困 【新智元导读】就在刚刚,CMU教授Zico Kolter正式宣布加入OpenAI董事会,并成为安全与安保委员会成员。OpenAI这是终于要在安全上...
CMU清华教LLM练成数学高手,LeanSTaR训练模型边思考边证明,登顶新SOTA
新智元报道编辑:乔杨 耳朵 【新智元导读】LLM数学水平不及小学生怎么办?CMU清华团队提出了Lean-STaR训练框架,在语言模型进行推理的每一步中都植入CoT,提...
AI顶会KDD’24今日截稿!Llama 3.1中文微调数据集已上线,超大模型一键部署
7 月的 AI 圈真是卷完小模型卷大模型,精彩不停!大多数同学都能体验 GPT-4o、Mistral-Nemo 这样的小模型,但 Llama-3.1-405B 和 Mistral-Large-2 这样的超大...
一年半了,AI 产品还没找到它的「二维码」
2011 年 11 月,微信更新了 v3.1,首发于诺基亚的塞班上,带来了「二维码」。一周后,这一功能也上线到了安卓和 iOS。 来源:微信官网 2012 年 5 月,张小龙...
AI搜索新战场,站在中心的仍是老牌搜索厂商
▲头图由AI生成 深度体验后,我发现了AI产品榜首的成功秘诀。 作者|香草 编辑|漠影 从拼技术走向拼应用,大模型落地的第一站到底是什么? 要回答这个问题,还...
GPT 新版本猜想:奥特曼草莓图引发推理热潮
一张草莓图,引爆AI界的无限猜想。作者丨刘洁 编辑丨岑峰 昨晚深夜,OpenAI首席执行官奥特曼(Sam Altman)在推特上发布了一张草莓的图片,并配文“我喜欢花园...
凯斯西储大学(Case Western Reserve) CS 系招收多名 AI/ML 博士/实习生
凯斯西储大学(Case Western Reserve University)助理教授 Xiaotian Han 博士招募2025Spring/Fall全奖博士/实习生(可远程),研究方向为探索高效LLMs、理解...
传零一万物完成数亿美元融资,某国际战投、东南亚财团加盟;开发者福音!OpenAI API 引入结构化输出功能丨AI情报局
01 今日融资快报零一万物完成数亿美元融资,某国际战投、东南亚财团加盟 李开复创办的AI大模型独角兽公司零一万物已经完成新一轮融资,金额达数亿美元。知情...
AI 搜索向左,搜索 OG 向右
Perplexity 们在横冲直闯,Google 们又岂会立正挨打?作者丨房晓楠 马晓宁 编辑丨陈彩娴 作为 AI 世界的领头羊,OpenAI 发布的 SearchGPT 再次给 AI 搜索加了...
欧洲版OpenAI CEO:开源模型没有任何风险,我只看到了好处
大数据文摘授权转载自学术头条 作者:Will Henshall 【编者按】有着“欧洲 OpenAI”之称的 Mistral AI,仅仅成立一年,估值就达到了 60 亿美元。 自成立以来,M...
Llama3训练每3小时崩一次?豆包大模型、港大团队为脆皮万卡训练提效
机器之心发布 机器之心编辑部伴随大模型迭代速度越来越快,训练集群规模越来越大,高频率的软硬件故障已经成为阻碍训练效率进一步提高的痛点,检查点(Checkp...
2024 Google 开发者大会主旨演讲精华回顾
2024 Google 开发者大会今日正式启幕! 一起回顾主旨演讲的精彩内容 获取前沿技术洞察,释放无限潜能Google 大中华区总裁陈俊廷首先上台分享,中国作为全球最...
欺诈层出不穷,AI与大模型如何助力金融机构应对挑战?
△点击上方卡片关注我,回复“实践”,即可获得 AI Agent、RAG、多模态大模型相关的案例资料 嘉宾 | 王小东 编辑 | Kimmy 随着技术的飞速发展,AI 攻击的成本几...
最强国产多模态刚刚易主!腾讯混元把GPT-4/Claude-3.5/Gemini-1.5都超了
梦晨 衡宇 发自 凹非寺量子位 | 公众号 QbitAI国产大模型,多模态能力都开始超越GPT-4-Turbo了?? 权威榜单,中文多模态大模型测评基准SuperCLUE-V,新鲜出...