位置 - OpenI

WPS接入DeepSeek，秒变办公神器！

WPS 大家经常用来日常写作，虽然本身提供了AI功能，但可惜需要会员，本文教你三分钟接入最火的DeepSeek，让WPS秒变办公神器。 DeepSeek API申请地址：http:/...

阅读原文

AI教程

1年前 (2025)

AI赚钱副业~AI生成影视解说，半个月涨粉变现3.5W+！

这两年大家都在感叹生活不易，然而我想说的是，机会还是有的，但问题不在于有没有，而在于你是否能够认准机会，然后抓住它。接触过很多咨询项目的人，发现...

使用教程

2年前 (2024)

猫猫方程，首次被物理学家！ |《美国物理学杂志》正经研究

白小交西小风发自凹非寺量子位 | 公众号 QbitAI猫猫和人的交互行为，竟然被物理学家用方程式写出来了！其成果还正经刊登在了《美国物理学杂志》上。起因...

阅读原文

AIGC动态

2年前 (2024)

14天速成LLM高手！大佬开源学习笔记，GitHub狂揽700星

新智元报道编辑：LRS 【新智元导读】一位AI从业者分享的14天学习路线图，涵盖大模型从基础到高级的主要关键概念！无论是面试找工作、还是自学创业，甚至想要...

阅读原文

AIGC动态

2年前 (2024)

NeurIPS 2024 | Transformer长度外推，全新位置编码DAPE大幅提升模型性能

AIxiv专栏是机器之心发布学术、技术内容的栏目。过去数年，机器之心AIxiv专栏接收报道了2000多篇内容，覆盖全球各大高校与企业的顶级实验室，有效促进了学术...

阅读原文

AIGC动态

2年前 (2024)

人人都能玩得起AI机器人！HuggingFace开源低成本解决方案

新智元报道编辑：alan 【新智元导读】近日，HuggingFace开源了低成本AI机器人LeRobot，并指导大家从头开始构建AI控制的机器人，包括组装、配置到训练控制机器...

阅读原文

AIGC动态

2年前 (2024)

「越狱」频发，如何教会大模型「迷途知返」而不是「将错就错」？

AIxiv专栏是机器之心发布学术、技术内容的栏目。过去数年，机器之心AIxiv专栏接收报道了2000多篇内容，覆盖全球各大高校与企业的顶级实验室，有效促进了学术...

阅读原文

AIGC动态

2年前 (2024)

公理训练让LLM学会因果推理：6700万参数模型比肩万亿参数级GPT-4

机器之心报道编辑：Panda把因果链展示给 LLM，它就能学会公理。AI 已经在帮助数学家和科学家做研究了，比如著名数学家陶哲轩就曾多次分享自己借助 GPT 等 AI...

阅读原文

AIGC动态

2年前 (2024)

超越扩散模型！自回归新范式仅需2.9秒就生成高质量图像，中科大哈工大度小满出品

STAR团队投稿自凹非寺量子位 | 公众号 QbitAI超越扩散模型！自回归范式在图像生成领域再次被验证—— 中科大、哈工大、度小满等机构提出通用文生图模型STAR。...

阅读原文

AIGC动态

2年前 (2024)

今日arXiv最热大模型论文：清华大学：一个简单缩放让大模型利用长上下文能力提升15.2%

夕小瑶科技说原创作者 | 谢年年不知道大家发现没有，一些大模型的提示技巧总是习惯将一些重要指令或信息放在提示的开头或者结尾。这是因为LLMs在处理上下...

阅读原文

AIGC动态

2年前 (2024)

ControlNet作者搞起大模型：让天下没有难写的生图提示词，一句话变构图小作文

梦晨西风发自凹非寺量子位 | 公众号 QbitAIControlNet作者新项目，居然也搞起大模型和Agent了。当然还是和AI绘画相关：解决大伙不会写提示词的痛点。现...

阅读原文

AIGC动态

2年前 (2024)

解决Transformer根本缺陷，CoPE论文爆火：所有大模型都能获得巨大改进

机器之心报道机器之心编辑部即使最强大的 LLM 也难以通过 token 索引来关注句子等概念，现在有办法了。最近两天，马斯克和 LeCun 的口水战妥妥成为大家的看...

阅读原文

AIGC动态

2年前 (2024)

清华发布Temporal Scaling Law，解释时间尺度对大模型表现的影响

夕小瑶科技说原创作者 | Axe_越众所周知，语言模型调参！预训练语言模型调参！！预训练大语言模型调参！！！简直就是一个指数级递增令人炸毛的事情，小...

阅读原文

AIGC动态

2年前 (2024)

小心！最新AI看一眼照片就定位你在哪里，精确到经纬度

金磊发自凹非寺量子位 | 公众号 QbitAI有点恐怖。现在，AI只需随意一张照片，就能知道你在哪里，而且是可以精确到经纬度的那种！例如下面这张随便到不能...

阅读原文

AIGC动态

2年前 (2024)

LLM上下文窗口突破200万！无需架构变化+复杂微调，轻松扩展8倍

新智元报道编辑：LRS 【新智元导读】LongRoPE方法首次将LLM的窗口扩展到了2048k个token，只是简单微调的情况下，就能实现与短上下文窗口相近的性能！大型语言...

阅读原文

AIGC动态

2年前 (2024)

微软发布！提示工程进化为位置工程，有效提升RAG与上下文学习

夕小瑶科技说原创作者 | 谢年年别再光顾着优化提示工程啦！微软最近推出位置工程研究思路，只需调整token的索引位置，而不修改文本本身，就能显著提高任务...

阅读原文

AIGC动态

2年前 (2024)

大模型扫盲系列——大模型实用技术介绍（上）

大数据文摘受权转载自数据派THU 编辑：黄继彦校对：林赣敏01 Gemma模型架构和参数计算上一篇文章《原创 | 大模型扫盲系列——初识大模型》从比较宏观的角度初...

阅读原文

AIGC动态

2年前 (2024)

标签：位置