标签:提示

一个小技巧,解锁ChatGPT「预测未来」?

新智元报道编辑:Mindy 【新智元导读】新研究利用了ChatGPT在2021年9月的训练数据截止这一限制,比较了ChatGPT在直接预测和未来叙事预测两种不同提示方式下,...
阅读原文

微调和量化竟会增加越狱风险!Mistral、Llama等无一幸免

新智元报道编辑:alan 【新智元导读】大模型的安全漏洞又填一笔!最新研究表明,对任何下游任务进行微调和量化都可能会影响LLM的安全性,即使本身并没有恶意...
阅读原文

Llama 3细节公布!AI产品总监站台讲解:Llama系列超庞大生态系统

新智元报道编辑:LRS 【新智元导读】除了计算资源和训练数据这些硬实力外,Llama 3模型开源的训练思路覆盖了LLM模型的全部生命周期,提供了各种开源生态系统...
阅读原文

神秘大模型一夜刷屏,能力太强被疑GPT-4.5,奥特曼避而不答打哑谜

梦晨 明敏 发自 凹非寺量子位 | 公众号 QbitAI一夜之间,大模型话题王,再次易主。 一个神秘模型突然杀入众人视野,能力超越一众开源模型,甚至包括GPT-4。几...
阅读原文

完整指南!如何在Visual Studio Code中轻松运行Llama 3模型

Meta 发布了最新的开源语言模型Llama 3。因为它是开源的,你可以下载这个模型,并在自己的电脑上运行。 我清楚,你可能会想,在个人笔记本上运行一个拥有80亿...
阅读原文

阿里智能体“组装工厂”开源!0经验搞定上万Agent并发

阿里巴巴通义实验室 投稿量子位 | 公众号 QbitAI让多智能体开发就像搭积木,阿里巴巴通义实验室开源多智能体编程框架与开发平台AgentScope。 该平台专门为多...
阅读原文

CVPR 2024 | 基于MoE的通用图像融合模型,添加2.8%参数完成多项任务

AIxiv专栏是机器之心发布学术、技术内容的栏目。过去数年,机器之心AIxiv专栏接收报道了2000多篇内容,覆盖全球各大高校与企业的顶级实验室,有效促进了学术...
阅读原文

我处理了 5 亿 GPT tokens 后:langchain、RAG 等都没什么用

作者 | KEN KANTZER 译者 | 平川 策划 | 褚杏娟 本文最初发布于 KEN KANTZER 的个人博客。 在过去的六个月里,我的创业公司 Truss(gettruss.io)发布了多项...
阅读原文

开箱黑盒LLM!谷歌大一统框架Patchscopes实战教程来了

新智元报道编辑:LRS 【新智元导读】大模型最为人诟病的问题就是不透明、不可解释。谷歌的最新框架Patchscopes可以提供关于模型内部隐藏表征的自然语言解释,...
阅读原文

新测试基准发布,最强开源Llama 3尴尬了

梦晨 发自 凹非寺量子位 | 公众号 QbitAI如果试题太简单,学霸和学渣都能考90分,拉不开差距…… 随着Claude 3、Llama 3甚至之后GPT-5等更强模型发布,业界急需...
阅读原文

今日arXiv最热NLP大模型论文:微软发布可视思维链VoT,提高大模型空间想象力

夕小瑶科技说 原创作者 | 芒果 引言:思维可视化技术的探索此项研究提出了一种名为思维可视化(VoT)的技术,旨在通过可视化大型语言模型(LLMs)的推理过程来增...
阅读原文

Stable Diffusion 3 API 发布!超越Midjourney v6和DALL-E 3

夕小瑶科技说 原创作者 | 任同学Stable Diffusion 3 于 2 月首次宣布作为预览版发布。而今天,StabilityAI 正式推出了 Stable Diffusion 3 和 Stable Diffusi...
阅读原文

「音乐界Sora」Udio来了:前DeepMind员工创业,比Suno可定制性更强

机器之心报道 机器之心编辑部我们已经看到,AI 已经能够理解和生成文本、图像、视频,尽管各个产品目前能达到的准确性和审美水准还不相同。 自带曲谱的音乐生...
阅读原文

GPT-4推理能力为0?开发者悬赏1万美金被打脸,神秘提示正确率直冲100%

新智元报道编辑:Aeneas 好困 【新智元导读】小孩子都会的脑筋急转弯推理题,GPT-4和Claude 3做不出?国外一位开发者小哥坚称这一观点,认为GPT模型在训练集...
阅读原文

多模态大模型有了统一分割框架,华科PSALM多任务登顶,模型代码全开源

机器之心专栏 机器之心编辑部最近,多模态大模型(LMM)取得了一系列引人注目的成就,特别是在视觉 - 语言任务上的表现令人瞩目。它们的成功不仅展现了多模态...
阅读原文
1789101120