标签:高效
AI赚钱副业~AI生成影视解说,半个月涨粉变现3.5W+!
这两年大家都在感叹生活不易,然而我想说的是,机会还是有的,但问题不在于有没有,而在于你是否能够认准机会,然后抓住它。 接触过很多咨询项目的人,发现...
集成500+多模态现实任务!全新MEGA-Bench评测套件:CoT对开源模型反而有害?
新智元报道编辑:LRST 【新智元导读】MEGA-Bench是一个包含500多个真实世界任务的多模态评测套件,为全面评估AI模型提供了高效工具。研究人员发现,尽管顶级A...
大模型“取长补短”新思路入选NeurIPS'24,显著优于现有路由方法,南科大港科大出品
RouterDC团队 投稿量子位 | 公众号 QbitAI高效组合多个大模型“取长补短”新思路,被顶会NeurIPS 2024接收。 名为RouterDC,是一种基于双重对比学习的路由架构...
扩散模型失宠?端侧非自回归图像生成基础模型Meissonic登场,超越SDXL!
新智元报道编辑:LRST 【新智元导读】刚刚,一款专为消费级显卡设计的全新非自回归掩码图像建模的文本到图像生成模型——Meissonic发布,标志着图像生成即将进...
玩转「智能体魔方」!清华推出AgentSquare模块化搜索框架,开启AI智能体高速进化时代
新智元报道编辑:LRST 好困 【新智元导读】AI智能体能像有机生命一样自适应演化吗?最近清华大学团队提出了AgentSquare模块化智能体设计框架,通过标准化的模...
万字长文细说端侧大模型进展
开讲预告11月7日晚7点,上海 AI Lab OpenGVLab 博士后研究员罗根,将以《Mono-InternVL: 突破原生多模态大模型性能瓶颈》为主题进行直播讲解,欢迎扫码报名~0...
清华团队革新MoE架构!像搭积木一样构建大模型,提出新型类脑稀疏模块化架构
CFM团队 投稿量子位 | 公众号 QbitAI探索更高效的模型架构, MoE是最具代表性的方向之一。 MoE架构的主要优势是利用稀疏激活的性质,将大模型拆解成若干功能...
吞吐量最高飙升20倍!豆包大模型团队开源RLHF框架,强化学习训练部署难题
新智元报道编辑:编辑部 HYZ 【新智元导读】强化学习(RL)对大模型复杂推理能力提升有关键作用,然而,RL 复杂的计算流程以及现有系统局限性,也给训练和部...
打破RLHF瓶颈,克服奖励!Meta发布全新后训练方式CGPO,编程水平直升5%
新智元报道编辑:LRST 【新智元导读】CGPO框架通过混合评审机制和约束优化器,有效解决了RLHF在多任务学习中的奖励欺骗和多目标优化问题,显著提升了语言模型...
解锁安防新质生产力!华为擎云获2024安防行业优秀解决方案奖
用安全高效的行业终端,为安防新质生产力加速。 作者|三北 编辑|漠影 当下,政务行业智能化转型加速发展,安全保障能力亟需强化。中共中央办公厅等部门今年10...
4090笔记本0.37秒直出大片!英伟达联手MIT清华祭出Sana架构,速度秒杀FLUX
新智元报道编辑:桃子 好困 【新智元导读】一台4090笔记本,秒生1K质量高清图。英伟达联合MIT清华团队提出的Sana架构,得益于核心架构创新,具备了惊人的图像...
给机器人装上「虫脑」?非Transformer液态神经网络终于来了!MIT CSAIL负责人创业成果
机器之心报道 机器之心编辑部一个受线虫启发的全新架构,三大「杯型」均能实现 SOTA 性能,资源高度受限环境也能部署。移动机器人可能更需要一个虫子的大脑。...
文档处理效能飙升!浩鲸科技“文档大模型”核心技术揭秘!
机器之心发布 机器之心编辑部在当今大模型技术日新月异的背景下,数据已跃升为构建企业大模型知识库、优化训练与微调,乃至驱动模型创新不可或缺的核心要素。...
边缘智能的新时代:端侧大模型的研究进展综述
AIxiv专栏是机器之心发布学术、技术内容的栏目。过去数年,机器之心AIxiv专栏接收报道了2000多篇内容,覆盖全球各大高校与企业的顶级实验室,有效促进了学术...
用60%成本干80%的事,DeepSeek分享沉淀多年的高性能深度学习架构
机器之心报道 编辑:Panda硬件发展速度跟不上 AI 需求,就需要精妙的架构和算法。根据摩尔定律,计算机的速度平均每两年就会翻一倍,但深度学习的发展速度还...
4B小模型掀翻大模型牌桌!性能超GPT-3.5,无限长文本性能超Kimi…
杀疯了!杀疯了! 你敢相信 4B 参数小模型,性能却超越千亿量级的 GPT-3.5 ! OpenAI、谷歌、微软、苹果等一众海内外巨头还没做到的事,被一家中国大模型公司...