标签:指令
OpenAI把GPT-4原始版给了他们:研究不微调只靠提示词能走多远
梦晨 发自 凹非寺量子位 | 公众号 QbitAI除了OpenAI自己,居然还有别人能用上GPT-4-Base版?? 也就是未经微调的预训练版,还不会对话聊天,只会补全句子的模...
用GPT-3.5生成数据集!北大天工等团队图像编辑新SOTA,可精准模拟物理世界场景
杨灵 投稿量子位 | 公众号 QbitAI高质量图像编辑的方法有很多,但都很难准确表达出真实的物理世界。 那么,Edit the World试试。 来自北京大学、Tiamat AI、...
无需OpenAI数据,跻身代码大模型榜单!UIUC发布StarCoder-15B-Instruct
新智元报道编辑:LRT 【新智元导读】通过StarCoder2-15B生成数千个指令-响应对,直接对StarCoder-15B基座模型进行微调,无需依赖昂贵的人工标注数据,也无需...
我是如何赢得GPT-4提示工程大赛冠军的
选自towardsdatascience 作者:Sheila Teo 机器之心编译 机器之心编辑部去年 11 月 8 日,新加坡政府科技局(GovTech)组织举办了首届 GPT-4 提示工程(Promp...
只需百行代码,让H100提速30%,斯坦福开源全新AI加速框架
机器之心报道 机器之心编辑部提高 GPU 利用率,就是这么简单。AI 的快速发展,伴随而来的是大计算量。这就自然而然的引出了一个问题:如何减少 AI 对计算的需...
中电信AI大模型TeleChat-12B评测:使用3T tokens预训练,已开源!
直播预告 | 5月14日晚7点,「智猩猩、AI新青年讲座」第235讲正式开讲,慕尼黑工业大学视觉实验室陈振宇博士将直播讲解《三维室内场景纹理图生成》欢迎扫码报...
今日arXiv最热NLP大模型论文:对指令太敏感?山东大学提出一致性对齐法,治好大模型敏感体质!
夕小瑶科技说 原创作者 | Axe_越不知道大家在使用大语言模型(LLM)的时候有没有遇到过,明明一模一样的意思,哪怕只有一两个字不同的指令给到大模型后,都会...
清华SuperBench全球测评出炉,Claude 3拿下多个冠军!合成数据才是人类未来?
新智元报道编辑:好困 Aeneas 【新智元导读】清华大学SuperBench团队的新一轮全球大模型评测中,Claude 3依然强到发指。在技术报告中,有人发现了Claude 3的...
「用 AI 训 AI」这事靠谱吗?
来源:节选自2024 年 Week04业内通讯在大语言模型领域,微调是改进模型的重要步骤。伴随开源模型数量日益增多,针对LLM的微调方法同样在推陈出新。 2024年初...
苹果一次性开源了8个大模型! 包含模型权重、训练日志和设置,OpenELM全面开源
夕小瑶科技说 原创作者 | 任同学不以开放性著称的苹果居然同时开源了大模型的权重、训练和评估框架,涵盖训练日志、多个保存点和预训练设置。同时升级计算机...
苹果OpenELM:设备瞬间变聪明,自家AI无需联网也能用
点击上方蓝字关注我们“苹果推出OpenELM,一系列开源大型语言模型可在设备端独立运行,无需云端支持。包含8款模型,参数规模2700万至30亿,部分预训练与指令调...
开源大模型Llama 3王者归来!最大底牌4000亿参数,性能直逼GPT-4
机器之心报道 机器之心编辑部扎克伯格:「有了 Llama 3,全世界就能拥有最智能的 AI。」 ChatGPT 拉开了大模型竞赛的序幕,Meta 似乎要后来居上了。 本周四,...
全球首个「开源GPT-4」出世!Llama 3震撼发布,Meta AI免登录可用
新智元报道编辑:编辑部 【新智元导读】蛰伏许久,Meta刚刚扔出了重磅炸弹:大家期待已久的Llama 3,用了24000块GPU训练,一亮相便登上开源大模型铁王座。8B...
H800竟然能白嫖了!还能一键部署Open Sora,潞晨云YYDS!
ChatGPT和Sora等AI大模型应用,将AI大模型和算力需求的热度不断带上新的台阶。 如何获得廉价算力,进行AI视频生成等模型开发和应用呢? 前不久,潞晨科技全面...
今日arXiv最热NLP大模型论文:斯坦福发布法律指令数据集LawInstruct,统一17个辖区24种语言
夕小瑶科技说 原创作者 | Tscom引言:法律领域的语言模型挑战与进展在法律领域,语言模型(Language Models, LLMs)的发展一直面临着独特的挑战。法律文本的...