标签:模型
清华团队革新MoE架构!像搭积木一样构建大模型,提出新型类脑稀疏模块化架构
CFM团队 投稿量子位 | 公众号 QbitAI探索更高效的模型架构, MoE是最具代表性的方向之一。 MoE架构的主要优势是利用稀疏激活的性质,将大模型拆解成若干功能...
多图场景用DPO对齐!上海AI实验室等提出新方法,无需人工标注
刘子煜 投稿量子位 | 公众号 QbitAI多图像场景也能用DPO方法来对齐了! 由上海交大、上海AI实验室、港中文等带来最新成果MIA-DPO。 这是一个面向大型视觉语言...
科研版AI搜索来了!知乎直答接入正版论文库,一手实测在此
鱼羊 发自 凹非寺量子位 | 公众号 QbitAI人在知乎,正经搞科研,这事儿越来越有谱了(doge)。 想了解下学术热点,直接一搜,AI不仅一步到位给出总结,连参考...
ChatGPT搜索功能上线!前1分钟,谷歌也宣布了自家AI搜索
夕小瑶科技说 分享来源 | 新智元ChatGPT搜索重磅登场!OpenAI官宣,ChatGPT从此正式变成AI搜索产品,要革了谷歌的命。而谷歌早在一分钟前,就官宣自家的AI搜...
推理成本直降99%!百川智能「1+3」矩阵揭秘,两张4090玩转旗舰新模型
新智元报道编辑:编辑部 HYZ 【新智元导读】大模型热,企业落地难?就在刚刚,百川智能推出「1+3」产品矩阵,一站式解决大模型商业化难题。「系列优质通用数...
吞吐量最高飙升20倍!豆包大模型团队开源RLHF框架,强化学习训练部署难题
新智元报道编辑:编辑部 HYZ 【新智元导读】强化学习(RL)对大模型复杂推理能力提升有关键作用,然而,RL 复杂的计算流程以及现有系统局限性,也给训练和部...
打破RLHF瓶颈,克服奖励!Meta发布全新后训练方式CGPO,编程水平直升5%
新智元报道编辑:LRST 【新智元导读】CGPO框架通过混合评审机制和约束优化器,有效解决了RLHF在多任务学习中的奖励欺骗和多目标优化问题,显著提升了语言模型...
一起理解下LLM的推理流程
本文来源自Pytorch Conference 2024的talking —— Understanding the LLM Inference Workload,由NVIDIA的高级解决方案架构师讲述,感兴趣的可以看原演讲视频...
一键取代谷歌成默认搜索引擎!ChatGPT搜索功能深夜炸场,奥特曼加速将谷歌逼向死亡
整理 | 华卫、冬梅、Tina、核子可乐 今日凌晨,OpenAI 突然宣布发布 ChatGPT 的最新功能:实时网络搜索,现已面向 Plus 和 Team 订阅者推出,并在未来几周内...
深度解读快手可图大模型的技术演进与应用探索
演讲嘉宾|李岩,快手可图大模型团队负责人 编辑 |蔡芳芳 策划 |AICon 全球人工智能开发与应用大会 图像与视频生成技术逐渐成为多个行业关注的焦点,特别...
ChatGPT AI搜索上线即翻车!OpenAI回应:Ilya看到了什么
用户吐槽:网页来源点开是空的,搜索结果还有幻觉。 作者|程茜 编辑|李水青 智东西11月1日报道,OpenAI的AI搜索终于来了!昨夜,OpenAI正式为ChatGPT推出网页...
狂砸10万片H100 GPU训练!扎克伯格剧透Llama 4,隔空对战马斯克
广告收入输血AI巨兽。 编译|汪越 编辑|漠影 智东西11月1日消息,据外媒Wired报道,在周三的Meta第三季度财报电话会议上,Meta首席执行官马克·扎克伯格(Mark ...
刚刚!ChatGPT正式成为AI搜索,免费可用
机器之心报道 机器之心编辑部时代变了,最强 AI 加持搜索引擎问世,没有广告。 终于等来这一天。 自今天起,ChatGPT 正式成为一款 AI 搜索引擎了!北京时间 1...
机器人迈向ChatGPT时刻!清华团队首次发现具身智能Scaling Laws
AIxiv专栏是机器之心发布学术、技术内容的栏目。过去数年,机器之心AIxiv专栏接收报道了2000多篇内容,覆盖全球各大高校与企业的顶级实验室,有效促进了学术...
NeurIPS 2024 | 机器人操纵世界模型来了,成功率超过谷歌RT-1 26.6%
AIxiv专栏是机器之心发布学术、技术内容的栏目。过去数年,机器之心AIxiv专栏接收报道了2000多篇内容,覆盖全球各大高校与企业的顶级实验室,有效促进了学术...