标签:模型
万字长文梳理LLM+RL(HF)的脉络
讲座预告11月1日上午10点,南开大学在读博士李森茂,将以《基于扩散模型编码器模块的推理加速》为主题进行直播讲解,欢迎扫码报名~导读作者为王小惟 Weixun ...
一块显卡理解一部电影,最新超长视频理解大模型出炉!“大海捞针”准确率近95%,代码已开源
允中 发自 凹非寺量子位 | 公众号 QbitAI仅需1块80G显卡,大模型理解小时级超长视频。 智源研究院联合上海交通大学、中国人民大学、北京大学和北京邮电大学等...
OpenAI-o1思考替代法火了!焦剑涛高徒一作提出思考偏好优化,不限于推理任务
西风 发自 凹非寺量子位 | 公众号 QbitAIOpenAI-o1替代品来了,大模型能根据任务复杂度进行不同时间的思考。 不限于推理性的逻辑或数学任务,一般问答也能思...
时序大模型突破十亿参数!新混合专家架构,普林斯顿格里菲斯等机构出品
TimeMoE团队 投稿自 凹非寺量子位 | 公众号 QbitAI时序大模型,参数规模突破十亿级别。 来自全球多只华人研究团队提出了一种基于混合专家架构(Mixture of Ex...
Claude团队喜提清华物理学霸姚顺宇!两个Yao Shunyu都投身大模型了
金磊 梦晨 发自 凹非寺量子位 | 公众号 QbitAI清华物理系传奇特奖得主Yao Shunyu,正式投身大模型,加入Anthropic的Claude团队。 有意思的是,另一位Yao Shun...
陶哲轩神预言!Transformer破解百年三体难题,凭数学直觉找到李雅普诺夫函数
新智元报道编辑:Aeneas 好困 【新智元导读】Transformer解决了三体问题?Meta研究者发现,132年前的数学难题——发现全局李雅普诺夫函数,可以被Transformer解...
一张显卡看遍天下电影!智源联合高校开源Video-XL打破长视频理解极限,95%准确率刷爆纪录
新智元报道编辑:编辑部 HYZ 【新智元导读】长视频理解迎来新纪元!智源联手国内多所顶尖高校,推出了超长视频理解大模型Video-XL。仅用一张80G显卡处理小时...
突破时间序列组合推理难题!南加大发布一站式多步推理框架TS-Reasoner
新智元报道编辑:LRST 【新智元导读】TS-Reasoner是一个创新的多步推理框架,结合了大型语言模型的上下文学习和推理能力,通过程序化多步推理、模块化设计、...
困扰18亿人的“全球干旱”,被AI更准确预测了
大数据文摘受权转载自学术头条 作者:阮文韵 编辑:学术君 图|在埃塞俄比亚西南部,气候变化导致干旱加剧。(来源:联合国儿童基金会/Pouget) “前所未有的...
金蝶发布首款AI移动应用苍穹APP,覆盖财务诊断、指标分析、员工服务等场景
作者 | 华卫 10 月 26 日,金蝶在主办的 2024 全球创见者大会上,重磅发布苍穹 APP,现场还开放了 AI 移动应用体验。这款 APP 是金蝶自主研发的 AI 管理助手...
大模型驱动行业升级,医疗、生产力工具与企业应用的实践探讨 | 直播预告
在大模型技术的推动下,AI 逐渐在各行各业中崭露头角。大模型是如何改变这些行业的游戏规则?又将如何帮助企业应对复杂的技术挑战,实现真正的智能化转型? 1...
【一周 AI 热点】AI 操控电脑和手机、纯血鸿蒙发布、多款文生图重磅更新、智谱及科大讯飞产品重大升级
国际要闻OpenAI驳斥 GPT-5 发布传闻,重组安全团队并加速AI媒体生成OpenAI首席执行官Sam Altman在社交媒体上驳斥了有关公司计划在年底前发布新AI模型Orion的...
先让不懂代码的来测?通义这个新产品,代码刚写完,预览就出来了
机器之心原创 机器之心编辑部这才是未来 AI 该有的样子?奇怪了。 一款 AI 代码工具刚发布,限量测试却要求「不懂代码」的人优先。10 月 24 日,阿里旗下的通...
谷歌AI播客刚火,Meta就开源了平替,效果一言难尽
机器之心报道 编辑:杜伟、陈陈随着谷歌和 Meta 相继推出基于大语言模型的 AI 播客功能,将极大地丰富人类用户与 AI 智能体互动的体验。上个月,谷歌宣布对旗...
世界模型新突破!极佳科技提出DriveDreamer4D,首次利用世界模型增强4D驾驶场景重建效果
机器之心发布 机器之心编辑部近日,极佳科技联合中国科学院自动化研究所、理想汽车、北京大学、慕尼黑工业大学等单位提出DriveDreamer4D,是首个利用世界模型...