大模型无限流式输入推理飙升46%!国产开源加速「全家桶」,打破多轮对话长度限制

新智元报道编辑:好困 桃子 【新智元导读】大模型推理再次跃升一个新台阶!最近,全新开源的国产SwiftInfer方案,不仅能让LLM处理无限流式输入,而且还将推理...
阅读原文

吊打斯坦福炒虾机器人!GPT-4加持Alter3扮鬼玩吉他,Figure 01看视频学会煮咖啡

新智元报道编辑:编辑部 【新智元导读】机器人的ChatGPT时刻,真来了!初创公司Figure自家机器人看了10小时视频,学会了煮咖啡。另一边,东京大学GPT-4加持的...
阅读原文

只需2分钟,单视图3D生成又快又好!北大等提出全新Repaint123方法

新智元报道编辑:LRS 好困 【新智元导读】将2D扩散模型的强大图像生成能力与再绘策略的纹理对齐能力结合起来,Repaint123能够在2分钟内从零开始生成具有多视...
阅读原文

微软祭出代码大模型WaveCoder!4项代码任务2万个实例数据集,让LLM泛化能力飙升

新智元报道编辑:桃子 【新智元导读】指令调优或许是让大模型性能提升最有潜力的方法。用高质量数据集进行指令调优,能让大模型性能快速提升。 对此,微软研...
阅读原文

回顾精彩瞬间!IEEE Spectrum盘点2023年度热门AI故事

新智元报道编辑:alan 【新智元导读】今年的AI一路高歌猛进,一年的结尾,IEEE Spectrum总结了本年度关于AI的最受欢迎的文章,让我们一同回顾这个2023又是冬...
阅读原文

多轮对话推理速度提升46%,开源方案打破LLM多轮对话的长度限制​

机器之心发布 机器之心编辑部在大型语言模型(LLM)的世界中,处理多轮对话一直是一个挑战。前不久麻省理工 Guangxuan Xiao 等人推出的 StreamingLLM,能够在...
阅读原文

轻量级模型,重量级性能,TinyLlama、LiteLlama小模型火起来了

机器之心报道 编辑:陈萍、大盘鸡小身板,大能量。 当大家都在研究大模型(LLM)参数规模达到百亿甚至千亿级别的同时,小巧且兼具高性能的小模型开始受到研究...
阅读原文

吃了几个原作者才能生成这么逼真的效果?文生图涉嫌视觉「抄袭」

机器之心报道 编辑:佳琪虽然提示词只是要生成「动画版的玩具」,但结果和《玩具总动员》没有区别。不久之前,《纽约时报》指控 OpenAI 涉嫌违规使用其内容用...
阅读原文

AI解读视频张口就来?这种「幻觉」难题Vista-LLaMA给解决了

机器之心专栏 机器之心编辑部Vista-LLaMA 在处理长视频内容方面的显著优势,为视频分析领域带来了新的解决框架。近年来,大型语言模型如 GPT、GLM 和 LLaMA ...
阅读原文

告别逐一标注,一个提示实现批量图片分割,高效又准确

机器之心专栏 机器之心编辑部仅需一个任务描述,即可一键分割所有图片! Segment Anything Model (SAM) 的提出在图像分割领域引起了巨大的关注,其卓越的泛化...
阅读原文

400万token上下文、推理再加速46%!最新开源方案升级MIT成果,推理成本再降低

明敏 发自 凹非寺量子位 | 公众号 QbitAI22倍加速还不够,再来提升46%,而且方法直接开源! 这就是开源社区改进MIT爆火项目StreamingLLM的最新成果。 Streami...
阅读原文

机器人又拿下一种家务:10小时学会煮咖啡,仅需观看人类演示视频

丰色 发自 凹非寺量子位 | 公众号 QbitAI上周斯坦福炒虾机器人炸场之后,又火了一个煮咖啡机器人。 它的厉害之处在于通过观看人类的示范视频,仅需10小时端到...
阅读原文

四行代码让大模型上下文暴增3倍,羊驼Mistral都适用

克雷西 发自 凹非寺量子位 | 公众号 QbitAI无需微调,只要四行代码就能让大模型窗口长度暴增,最高可增加3倍! 而且是“即插即用”,理论上可以适配任意大模型...
阅读原文

余震强度预测能力升级,Nature 刊文认证基于神经网络的模型性能优于传统模型

作者:李宝珠 编辑:李玮栋、xixi,三羊 地震的发生涉及诸多变量,「预测」存在挑战,但余震发生次数及强度的预测已取得重大进展。2023 年 12 月 18 日 23 时...
阅读原文

美国风险投融资额下降60%,创六年来新低

点击上方蓝字关注我们“2023年美国风投创六年来最低筹资额,全球风投陷资金荒,初创企业面临退出难题。风投公司难筹新资金,有限合伙人撤资,市场衰退令现金充...
阅读原文