标签：指令

OpenAI把GPT-4原始版给了他们：研究不微调只靠提示词能走多远

梦晨发自凹非寺量子位 | 公众号 QbitAI除了OpenAI自己，居然还有别人能用上GPT-4-Base版？？也就是未经微调的预训练版，还不会对话聊天，只会补全句子的模...

阅读原文

AIGC动态

2年前 (2024)

用GPT-3.5生成数据集！北大天工等团队图像编辑新SOTA，可精准模拟物理世界场景

杨灵投稿量子位 | 公众号 QbitAI高质量图像编辑的方法有很多，但都很难准确表达出真实的物理世界。那么，Edit the World试试。来自北京大学、Tiamat AI、...

阅读原文

AIGC动态

2年前 (2024)

无需OpenAI数据，跻身代码大模型榜单！UIUC发布StarCoder-15B-Instruct

新智元报道编辑：LRT 【新智元导读】通过StarCoder2-15B生成数千个指令-响应对，直接对StarCoder-15B基座模型进行微调，无需依赖昂贵的人工标注数据，也无需...

阅读原文

AIGC动态

2年前 (2024)

我是如何赢得GPT-4提示工程大赛冠军的

选自towardsdatascience 作者：Sheila Teo 机器之心编译机器之心编辑部去年 11 月 8 日，新加坡政府科技局（GovTech）组织举办了首届 GPT-4 提示工程（Promp...

阅读原文

AIGC动态

2年前 (2024)

只需百行代码，让H100提速30%，斯坦福开源全新AI加速框架

机器之心报道机器之心编辑部提高 GPU 利用率，就是这么简单。AI 的快速发展，伴随而来的是大计算量。这就自然而然的引出了一个问题：如何减少 AI 对计算的需...

阅读原文

AIGC动态

2年前 (2024)

中电信AI大模型TeleChat-12B评测：使用3T tokens预训练，已开源！

直播预告 | 5月14日晚7点，「智猩猩、AI新青年讲座」第235讲正式开讲，慕尼黑工业大学视觉实验室陈振宇博士将直播讲解《三维室内场景纹理图生成》欢迎扫码报...

阅读原文

AIGC动态

2年前 (2024)

今日arXiv最热NLP大模型论文：对指令太敏感？山东大学提出一致性对齐法，治好大模型敏感体质！

夕小瑶科技说原创作者 | Axe_越不知道大家在使用大语言模型（LLM）的时候有没有遇到过，明明一模一样的意思，哪怕只有一两个字不同的指令给到大模型后，都会...

阅读原文

AIGC动态

2年前 (2024)

清华SuperBench全球测评出炉，Claude 3拿下多个冠军！合成数据才是人类未来？

新智元报道编辑：好困 Aeneas 【新智元导读】清华大学SuperBench团队的新一轮全球大模型评测中，Claude 3依然强到发指。在技术报告中，有人发现了Claude 3的...

阅读原文

AIGC动态

2年前 (2024)

「用 AI 训 AI」这事靠谱吗？

来源：节选自2024 年 Week04业内通讯在大语言模型领域，微调是改进模型的重要步骤。伴随开源模型数量日益增多，针对LLM的微调方法同样在推陈出新。 2024年初...

阅读原文

AIGC动态

2年前 (2024)

苹果一次性开源了8个大模型！包含模型权重、训练日志和设置，OpenELM全面开源

夕小瑶科技说原创作者 | 任同学不以开放性著称的苹果居然同时开源了大模型的权重、训练和评估框架，涵盖训练日志、多个保存点和预训练设置。同时升级计算机...

阅读原文

AIGC动态

2年前 (2024)

苹果OpenELM：设备瞬间变聪明，自家AI无需联网也能用

点击上方蓝字关注我们“苹果推出OpenELM，一系列开源大型语言模型可在设备端独立运行，无需云端支持。包含8款模型，参数规模2700万至30亿，部分预训练与指令调...

阅读原文

AIGC动态

2年前 (2024)

开源大模型Llama 3王者归来！最大底牌4000亿参数，性能直逼GPT-4

机器之心报道机器之心编辑部扎克伯格：「有了 Llama 3，全世界就能拥有最智能的 AI。」 ChatGPT 拉开了大模型竞赛的序幕，Meta 似乎要后来居上了。本周四，...

阅读原文

AIGC动态

2年前 (2024)

全球首个「开源GPT-4」出世！Llama 3震撼发布，Meta AI免登录可用

新智元报道编辑：编辑部【新智元导读】蛰伏许久，Meta刚刚扔出了重磅炸弹：大家期待已久的Llama 3，用了24000块GPU训练，一亮相便登上开源大模型铁王座。8B...

阅读原文

AIGC动态

2年前 (2024)

H800竟然能白嫖了！还能一键部署Open Sora，潞晨云YYDS！

ChatGPT和Sora等AI大模型应用，将AI大模型和算力需求的热度不断带上新的台阶。如何获得廉价算力，进行AI视频生成等模型开发和应用呢？前不久，潞晨科技全面...

阅读原文

AIGC动态

2年前 (2024)

今日arXiv最热NLP大模型论文：斯坦福发布法律指令数据集LawInstruct，统一17个辖区24种语言

夕小瑶科技说原创作者 | Tscom引言：法律领域的语言模型挑战与进展在法律领域，语言模型（Language Models, LLMs）的发展一直面临着独特的挑战。法律文本的...

阅读原文

AIGC动态

2年前 (2024)

1…3 456 7…11