标签:上下文
iPhone上最强模型出现!性能超越GPT-4,Siri有救啦?
夕小瑶科技说 原创作者 | 任同学 你有多久没用你的Siri了呢?对于一个曾市值超过三万亿美元的科技巨头,苹果在人工智能方向上的实力还值得大家期待吗? 最近...
中科院发布大模型想象增强法IAG,无需外部资源,想想就能变强
夕小瑶科技说 原创作者 | 松果 引言:探索知识增强的新方法在人工智能领域,尤其是自然语言处理(NLP)的子领域——问答系统(QA)中,知识的获取和利用一直是...
人工智能助力语音助手:苹果新方法超越GPT-4
点击上方蓝字关注我们“苹果公司近期提出一种名为ReALM(Reference Resolution As Language Modeling)的方法,通过将上下文信息转化为语言模型问题,成功解决...
「有效上下文」提升20倍!DeepMind发布ReadAgent框架
新智元报道编辑:LRS 【新智元导读】模仿人类阅读过程,先分段摘要再回忆,谷歌新框架ReadAgent在三个长文档阅读理解数据集上取得了更强的性能,有效上下文提...
首个开源世界模型!百万级上下文,长视频理解吊打GPT-4,UC伯克利华人一作
新智元报道编辑:alan 【新智元导读】来自UC berkeley的研究人员开源了首个世界模型,多模态性能优秀,长视频理解吊打GPT-4,同时将上下文长度增加到百万级别...
AI 大模型已被破解!Claude 团队最新“越狱”论文把各家模型全部洗脑了一遍
来源:CSDN(ID:CSDNnews) 作者:王启隆 昨日,凭借着 Claude 大模型和 GPT-4 打的不可开交的人工智能创业公司Anthropic公布了一篇论文,文中详述了当前大...
OpenAI竞对用256轮对话「灌醉」大模型,Claude被骗造出炸弹!
新智元报道编辑:alan flynne 【新智元导读】就在刚刚,Anthropic发现了大模型的惊人漏洞。经过256轮对话后,Claude 2逐渐被「灌醉」,开始疯狂越狱,帮人类...
马斯克突发Grok 1.5!上下文长度至128k、HumanEval得分超GPT-4
丰色 西风 发自 凹非寺量子位 | 公众号 QbitAI就在刚刚,马斯克Grok大模型宣布重大升级。 难怪之前突然开源了Grok-1,因为他有更强的Grok-1.5了,主打推理能...
Mamba架构第一次做大!混合Transformer,打败Transformer
丰色 发自 凹非寺量子位 | 公众号 QbitAI精彩精彩,第一个把爆火Mamba架构真正扩展到足够大的工作来了。 520亿参数,还是Mamba+Transformer混合架构。 它的名...
Attention isn’t all you need!Mamba混合大模型开源:三倍Transformer吞吐量
机器之心报道 编辑:小舟Mamba 时代来了? 自 2017 年开创性研究论文《Attention is All You Need》问世以来,transformer 架构就一直主导着生成式人工智能领...
Mamba超强进化体一举颠覆Transformer!单张A100跑140K上下文
新智元报道编辑:编辑部 【新智元导读】52B的生产级Mamba大模型来了!这个超强变体Jamba刚刚打破世界纪录,它能正面硬刚Transformer,256K超长上下文窗口,吞...
开源11天,马斯克再发Grok-1.5!128K代码击败GPT-4
新智元报道编辑:桃子 好困 【新智元导读】马斯克「搞笑」模型刚刚升级到Grok-1.5,推理性能暴涨,支持128k长上下文。最重要的是,Grok-1.5的数学和代码能力...
马斯克发布Grok 1.5! 编码和数学能力大幅提升
夕小瑶科技说 分享来源 | 量子位就在刚刚,马斯克Grok大模型宣布重大升级。 难怪之前突然开源了Grok-1,因为他有更强的Grok-1.5了,主打推理能力。 来自xAI的...
月之暗面Kimi正被大厂“围剿”:90后清华学霸带队“卷”长文本,不到一年估值破百亿
作者|冬梅 上周,月之暗面(Moonshot AI)公司宣布旗下对话式 AI 助理产品 Kimi 应用现已支持 200 万字无损上下文输入。去年 10 月发布时,Kimi 仅支持 20 ...