标签:长度
AI赚钱副业~AI生成影视解说,半个月涨粉变现3.5W+!
这两年大家都在感叹生活不易,然而我想说的是,机会还是有的,但问题不在于有没有,而在于你是否能够认准机会,然后抓住它。 接触过很多咨询项目的人,发现...
视频大模型无损提速:删除多余token,训练时间减少30%,帧率越高效果越好 | NeurIPS
克雷西 发自 凹非寺量子位 | 公众号 QbitAIDon’t look twice! 把连续相同的图像块合并成一个token,就能让Transformer的视频处理速度大幅提升。 卡内基梅隆...
无问芯穹提出混合稀疏注意力方案MoA,加速长文本生成,实现最高8倍吞吐率提升
机器之心发布 机器之心编辑部随着大语言模型在长文本场景下的需求不断涌现,其核心的注意力机制(Attention Mechanism)也获得了非常多的关注。 注意力机制会...
NeurIPS 2024 | Transformer长度外推,全新位置编码DAPE大幅提升模型性能
AIxiv专栏是机器之心发布学术、技术内容的栏目。过去数年,机器之心AIxiv专栏接收报道了2000多篇内容,覆盖全球各大高校与企业的顶级实验室,有效促进了学术...
米开朗基罗怎么说?谷歌DeepMind推出长上下文评估新框架
新智元报道编辑:alan 【新智元导读】近日,来自谷歌DeepMind的研究人员提出了Michelangelo,「用米开朗基罗的观点」来测量任意上下文长度的基础模型性能。米...
OpenAI重磅发布Canvas:跟ChatGPT一起写作编程
来源:量子位 | 公众号 QbitAI金磊 发自 凹非寺今天凌晨,OpenAI又有了一个大动作—— 发布Canvas,一个与ChatGPT合作写作和编程的新界面! 这个全新的界面,是...
666条数据教会AI写万字长文!模型数据集都开源
魔搭ModelScope团队 投稿量子位 | 公众号 QbitAI仅需600多条数据,就能训练自己的长输出模型了?! 事情是酱婶儿的—— 虽然大模型的上下文(Context)支持越来越...
Meta:大语言模型可以通过自我批判取得大幅提升!
夕小瑶科技说 原创作者 | 谢年年论文的审稿模式想必大家都不会陌生,一篇论文除了分配多个评审,最后还将由PC综合评估各位审稿人的reviews撰写meta-review。 ...
谷歌揭秘大模型不会数r原因:嵌入维度是关键,不止分词器问题
克雷西 发自 凹非寺量子位 | 公众号 QbitAI大模型做奥赛题游刃有余,简单的数数却屡屡翻车的原因找到了。 谷歌的一项新研究,发现大模型不会数数的原因,并不...
GPT-4o mini排名雪崩,大模型竞技场规则更新,奥特曼刷分小技巧无效了
梦晨 发自 凹非寺量子位 | 公众号 QbitAI大模型竞技场规则更新,GPT-4o mini排名立刻雪崩,跌出前10。 新榜单对AI回答的长度和风格等特征做了降权处理,确保...
“防御性”编程弱爆了,我选择“进攻性”编程
Hello,大家好,我是 JioNLP。 应该都听说过防御性编程吧? 程序员们为了防止被裁员,需要把程序写得乱糟糟的: 要么是层层抽象,每一层都特别难理解,搞得其...
清华唐杰团队新作:一口气生成2万字,大模型开卷长输出
明敏 发自 凹非寺量子位 | 公众号 QbitAI一口气生成2万字,大模型输出也卷起来了! 清华&智谱AI最新研究,成功让GLM-4、Llama-3.1输出长度都暴增。 相同...
30秒生成建模师级Mesh!最大可生成面数提升至1600,GitHub揽星1.9k项目发布V2版本
木子 投稿量子位 | 公众号 QbitAI只需30秒,AI就能像3D建模师一样,在各种指示下生成高质量人造Mesh。 NeRF、3D Gaussian Splatting生成的三维重建图像Mesh效...
NVIDIA把Llama-3的上下文长度扩展16倍,长上下文理解能力超越GPT-4
夕小瑶科技说 原创作者 | Richard在 Llama-3.1 模型发布之前,开源模型与闭源模型的性能之间一直存在较大的差距,尤其是在长上下文理解能力上。 大模型的上下...
4轮暴训,Llama 7B击败GPT-4!Meta等让LLM「分饰三角」自评自进化
新智元报道编辑:编辑部 【新智元导读】Meta、UC伯克利、NYU共同提出元奖励语言模型,给「超级对齐」指条明路:让AI自己当裁判,自我改进对齐,效果秒杀自我...
开源超闭源!通义千问Qwen2发布即爆火,网友:GPT-4o危
鱼羊 发自 凹非寺量子位 | 公众号 QbitAI开源大模型全球格局,一夜再变。 这不,全新开源大模型亮相,性能全面超越开源标杆Llama 3。王座易主了。不是“媲美”...