标签:位置
AI赚钱副业~AI生成影视解说,半个月涨粉变现3.5W+!
这两年大家都在感叹生活不易,然而我想说的是,机会还是有的,但问题不在于有没有,而在于你是否能够认准机会,然后抓住它。 接触过很多咨询项目的人,发现...
NeurIPS 2024 | Transformer长度外推,全新位置编码DAPE大幅提升模型性能
AIxiv专栏是机器之心发布学术、技术内容的栏目。过去数年,机器之心AIxiv专栏接收报道了2000多篇内容,覆盖全球各大高校与企业的顶级实验室,有效促进了学术...
人人都能玩得起AI机器人!HuggingFace开源低成本解决方案
新智元报道编辑:alan 【新智元导读】近日,HuggingFace开源了低成本AI机器人LeRobot,并指导大家从头开始构建AI控制的机器人,包括组装、配置到训练控制机器...
「越狱」事件频发,如何教会大模型「迷途知返」而不是「将错就错」?
AIxiv专栏是机器之心发布学术、技术内容的栏目。过去数年,机器之心AIxiv专栏接收报道了2000多篇内容,覆盖全球各大高校与企业的顶级实验室,有效促进了学术...
公理训练让LLM学会因果推理:6700万参数模型比肩万亿参数级GPT-4
机器之心报道 编辑:Panda把因果链展示给 LLM,它就能学会公理。AI 已经在帮助数学家和科学家做研究了,比如著名数学家陶哲轩就曾多次分享自己借助 GPT 等 AI...
超越扩散模型!自回归新范式仅需2.9秒就生成高质量图像,中科大哈工大度小满出品
STAR团队 投稿自 凹非寺量子位 | 公众号 QbitAI超越扩散模型!自回归范式在图像生成领域再次被验证—— 中科大、哈工大、度小满等机构提出通用文生图模型STAR。...
今日arXiv最热大模型论文:清华大学:一个简单缩放让大模型利用长上下文能力提升15.2%
夕小瑶科技说 原创作者 | 谢年年 不知道大家发现没有,一些大模型的提示技巧总是习惯将一些重要指令或信息放在提示的开头或者结尾。 这是因为LLMs在处理上下...
ControlNet作者搞起大模型:让天下没有难写的生图提示词,一句话变构图小作文
梦晨 西风 发自 凹非寺量子位 | 公众号 QbitAIControlNet作者新项目,居然也搞起大模型和Agent了。 当然还是和AI绘画相关:解决大伙不会写提示词的痛点。 现...
解决Transformer根本缺陷,CoPE论文爆火:所有大模型都能获得巨大改进
机器之心报道 机器之心编辑部即使最强大的 LLM 也难以通过 token 索引来关注句子等概念,现在有办法了。最近两天,马斯克和 LeCun 的口水战妥妥成为大家的看...
清华发布Temporal Scaling Law,解释时间尺度对大模型表现的影响
夕小瑶科技说 原创作者 | Axe_越众所周知, 语言模型调参! 预训练语言模型调参!! 预训练大语言模型调参!!! 简直就是一个指数级递增令人炸毛的事情,小...
小心!最新AI看一眼照片就定位你在哪里,精确到经纬度
金磊 发自 凹非寺量子位 | 公众号 QbitAI有点恐怖。 现在,AI只需随意一张照片,就能知道你在哪里,而且是可以精确到经纬度的那种! 例如下面这张随便到不能...
LLM上下文窗口突破200万!无需架构变化+复杂微调,轻松扩展8倍
新智元报道编辑:LRS 【新智元导读】LongRoPE方法首次将LLM的窗口扩展到了2048k个token,只是简单微调的情况下,就能实现与短上下文窗口相近的性能!大型语言...
微软发布!提示工程进化为位置工程,有效提升RAG与上下文学习
夕小瑶科技说 原创作者 | 谢年年 别再光顾着优化提示工程啦!微软最近推出位置工程研究思路,只需调整token的索引位置,而不修改文本本身,就能显著提高任务...
大模型扫盲系列——大模型实用技术介绍(上)
大数据文摘受权转载自数据派THU 编辑:黄继彦 校对:林赣敏01 Gemma模型架构和参数计算 上一篇文章《原创 | 大模型扫盲系列——初识大模型》从比较宏观的角度初...
LongRoPE:超越极限,将大模型上下文窗口扩展超过200万tokens
大数据文摘受权转载自微软亚洲研究院 编者按:大模型的飞速发展给人们的生活带来了前所未有的便利。我们是否能够设想利用大模型的潜力,快速扫描整部百科全书...
上海交大新框架解锁CLIP长文本能力,多模态生成细节拿捏,图像检索能力显著提升
白交 发自 凹非寺量子位 | 公众号 QbitAICLIP长文本能力被解锁,图像检索任务表现显著提升! 一些关键细节也能被捕捉到。上海交大联合上海AI实验室提出新框架...