标签:上下文
AI赚钱副业~AI生成影视解说,半个月涨粉变现3.5W+!
这两年大家都在感叹生活不易,然而我想说的是,机会还是有的,但问题不在于有没有,而在于你是否能够认准机会,然后抓住它。 接触过很多咨询项目的人,发现...
Qwen2.5更新百万超长上下文,推理速度4.3倍加速,网友:RAG要过时了
鱼羊 发自 凹非寺量子位 | 公众号 QbitAI国产大模型,最近有点卷。 这不,刚在写代码这事儿上刷新SOTA,Qwen2.5系列又双叒突然更新了—— 一口气读三本《三体》...
NeurIPS 2024 | 自我纠错如何使OpenAI o1推理能力大大加强?北大、MIT团队给出理论解释
AIxiv专栏是机器之心发布学术、技术内容的栏目。过去数年,机器之心AIxiv专栏接收报道了2000多篇内容,覆盖全球各大高校与企业的顶级实验室,有效促进了学术...
谷歌杀回来了!新版Gemini跑分超o1登顶第一,CEO:这才哪到哪儿
一水 发自 凹非寺量子位 | 公众号 QbitAI鲨疯了!谷歌新版Gemini超越o1,强势登顶竞技场总榜第一! 在经6000+网友匿名投票后,不仅数学成绩和学霸o1相当,还...
无问芯穹提出混合稀疏注意力方案MoA,加速长文本生成,实现最高8倍吞吐率提升
机器之心发布 机器之心编辑部随着大语言模型在长文本场景下的需求不断涌现,其核心的注意力机制(Attention Mechanism)也获得了非常多的关注。 注意力机制会...
微软清华改进Transformer:用降噪耳机原理升级注意力,一作在线答疑
梦晨 发自 凹非寺量子位 | 公众号 QbitAITransformer自问世后就大放异彩,但有个小毛病一直没解决: 总爱把注意力放在不相关的内容上,也就是信噪比低。 现在...
突发!OpenAI正式发布ChatGPT网络搜索,彻底颠覆谷歌!
开讲预告11月7日晚7点,上海 AI Lab OpenGVLab 博士后研究员 罗根,将以《Mono-InternVL: 突破原生多模态大模型性能瓶颈》为主题进行直播讲解,欢迎扫码报名~...
导航、采矿、建造,北大这个新智能体把《我的世界》玩透了
AIxiv专栏是机器之心发布学术、技术内容的栏目。过去数年,机器之心AIxiv专栏接收报道了2000多篇内容,覆盖全球各大高校与企业的顶级实验室,有效促进了学术...
OpenAI今天Open了一下:开源多智能体框架Swarm
夕小瑶科技说 分享来源 | 机器之心毫无疑问,多智能体肯定是 OpenAI 未来重要的研究方向之一,前些天 OpenAI 著名研究科学家 Noam Brown还在 X 上为 OpenAI ...
米开朗基罗怎么说?谷歌DeepMind推出长上下文评估新框架
新智元报道编辑:alan 【新智元导读】近日,来自谷歌DeepMind的研究人员提出了Michelangelo,「用米开朗基罗的观点」来测量任意上下文长度的基础模型性能。米...
Lex Fridman对谈Cursor团队:真正找到PMF的AI编程产品,有信心取代Copilot
Cursor 最近很火,甚至被认为可能是取代 VS Code 的下一代代码编辑器。 Cursor 一开始就没有把自己定位在 Copilot 的角色上,团队认为,大模型会颠覆软件的开...
这篇论文非常火!差分Transformer竟能消除注意力噪声,犹如降噪耳机
机器之心报道 编辑:PandaTransformer 的强大实力已经在诸多大型语言模型(LLM)上得到了证明,但该架构远非完美,也有很多研究者致力于改进这一架构,比如机...
清华微软最新力作:用物理学革新Transformer注意力,「大海捞针」精度暴涨30%!
新智元报道编辑:乔杨 好困 【新智元导读】随着诺贝尔物理学奖颁给了「机器学习之父」Geoffrey Hinton,另一个借鉴物理学概念的模型架构也横空出世——微软清华...
Cursor创始团队最新访谈:如果Github整合o1,Cursor可能要倒闭了
机器之心报道 编辑:佳琪、蛋酱最近一段时间,AI 编程工具 Cursor 火遍全球,风头一时无两。 Cursor 是一款基于 VS Code 的代码编辑器,它为 AI 辅助编程添加...
AI也会做梦吗?什么是AI幻觉?
AI幻觉,简单来说,是指人工智能系统(自然语言处理模型)生成的内容与真实数据不符,或偏离用户指令的现象,就像人类说“梦话”一样~ 那么AI幻觉有哪些?是什...
Kimi 背后的长文本大模型推理实践:以 KVCache 为中心的分离式推理架构
演讲嘉宾|唐飞虎 编辑 |蔡芳芳 策划 |AICon 全球人工智能开发与应用大会 在不久前举办的 AICon 全球人工智能开发与应用大会上,月之暗面高级研发工程师、...