标签：长度

WPS接入DeepSeek，秒变办公神器！

WPS 大家经常用来日常写作，虽然本身提供了AI功能，但可惜需要会员，本文教你三分钟接入最火的DeepSeek，让WPS秒变办公神器。 DeepSeek API申请地址：http:/...

阅读原文

AI教程

9个月前

AI赚钱副业~AI生成影视解说，半个月涨粉变现3.5W+！

这两年大家都在感叹生活不易，然而我想说的是，机会还是有的，但问题不在于有没有，而在于你是否能够认准机会，然后抓住它。接触过很多咨询项目的人，发现...

使用教程

1年前 (2024)

视频大模型无损提速：删除多余token，训练时间减少30%，帧率越高效果越好 | NeurIPS

克雷西发自凹非寺量子位 | 公众号 QbitAIDon’t look twice！把连续相同的图像块合并成一个token，就能让Transformer的视频处理速度大幅提升。卡内基梅隆...

阅读原文

AIGC动态

12个月前

无问芯穹提出混合稀疏注意力方案MoA，加速长文本生成，实现最高8倍吞吐率提升

机器之心发布机器之心编辑部随着大语言模型在长文本场景下的需求不断涌现，其核心的注意力机制（Attention Mechanism）也获得了非常多的关注。注意力机制会...

阅读原文

AIGC动态

12个月前

NeurIPS 2024 | Transformer长度外推，全新位置编码DAPE大幅提升模型性能

AIxiv专栏是机器之心发布学术、技术内容的栏目。过去数年，机器之心AIxiv专栏接收报道了2000多篇内容，覆盖全球各大高校与企业的顶级实验室，有效促进了学术...

阅读原文

AIGC动态

1年前 (2024)

米开朗基罗怎么说？谷歌DeepMind推出长上下文评估新框架

新智元报道编辑：alan 【新智元导读】近日，来自谷歌DeepMind的研究人员提出了Michelangelo，「用米开朗基罗的观点」来测量任意上下文长度的基础模型性能。米...

阅读原文

AIGC动态

1年前 (2024)

OpenAI重磅发布Canvas：跟ChatGPT一起写作编程

来源：量子位 | 公众号 QbitAI金磊发自凹非寺今天凌晨，OpenAI又有了一个大动作—— 发布Canvas，一个与ChatGPT合作写作和编程的新界面！这个全新的界面，是...

阅读原文

AIGC动态

1年前 (2024)

666条数据教会AI写万字长文！模型数据集都开源

魔搭ModelScope团队投稿量子位 | 公众号 QbitAI仅需600多条数据，就能训练自己的长输出模型了？！事情是酱婶儿的—— 虽然大模型的上下文(Context)支持越来越...

阅读原文

AIGC动态

1年前 (2024)

Meta：大语言模型可以通过自我批判取得大幅提升！

夕小瑶科技说原创作者 | 谢年年论文的审稿模式想必大家都不会陌生，一篇论文除了分配多个评审，最后还将由PC综合评估各位审稿人的reviews撰写meta-review。 ...

阅读原文

AIGC动态

1年前 (2024)

谷歌揭秘大模型不会数r原因：嵌入维度是关键，不止分词器问题

克雷西发自凹非寺量子位 | 公众号 QbitAI大模型做奥赛题游刃有余，简单的数数却屡屡翻车的原因找到了。谷歌的一项新研究，发现大模型不会数数的原因，并不...

阅读原文

AIGC动态

1年前 (2024)

GPT-4o mini排名雪崩，大模型竞技场规则更新，奥特曼刷分小技巧无效了

梦晨发自凹非寺量子位 | 公众号 QbitAI大模型竞技场规则更新，GPT-4o mini排名立刻雪崩，跌出前10。新榜单对AI回答的长度和风格等特征做了降权处理，确保...

阅读原文

AIGC动态

1年前 (2024)

“防御性”编程弱爆了，我选择“进攻性”编程

Hello，大家好，我是 JioNLP。应该都听说过防御性编程吧？程序员们为了防止被裁员，需要把程序写得乱糟糟的：要么是层层抽象，每一层都特别难理解，搞得其...

阅读原文

AIGC动态

1年前 (2024)

清华唐杰团队新作：一口气生成2万字，大模型开卷长输出

明敏发自凹非寺量子位 | 公众号 QbitAI一口气生成2万字，大模型输出也卷起来了！清华&智谱AI最新研究，成功让GLM-4、Llama-3.1输出长度都暴增。相同...

阅读原文

AIGC动态

1年前 (2024)

30秒生成建模师级Mesh！最大可生成面数提升至1600，GitHub揽星1.9k项目发布V2版本

木子投稿量子位 | 公众号 QbitAI只需30秒，AI就能像3D建模师一样，在各种指示下生成高质量人造Mesh。 NeRF、3D Gaussian Splatting生成的三维重建图像Mesh效...

阅读原文

AIGC动态

1年前 (2024)

NVIDIA把Llama-3的上下文长度扩展16倍，长上下文理解能力超越GPT-4

夕小瑶科技说原创作者 | Richard在 Llama-3.1 模型发布之前，开源模型与闭源模型的性能之间一直存在较大的差距，尤其是在长上下文理解能力上。大模型的上下...

阅读原文

AIGC动态

1年前 (2024)

4训，Llama 7B击败GPT-4！Meta等让LLM「分饰三角」自评自进化

新智元报道编辑：编辑部【新智元导读】Meta、UC伯克利、NYU共同提出元奖励语言模型，给「超级对齐」指条明路：让AI自己当裁判，自我改进对齐，效果秒杀自我...

阅读原文

AIGC动态

1年前 (2024)

开源超闭源！通义千问Qwen2发布即爆火，网友：GPT-4o危

鱼羊发自凹非寺量子位 | 公众号 QbitAI开源大模型全球格局，一夜再变。这不，全新开源大模型亮相，性能全面超越开源标杆Llama 3。王座易主了。不是“媲美”...

阅读原文

AIGC动态

1年前 (2024)

12 3 4