标签:模型
上海交大发布大模型双语编程评估基准CodeApex,机器真的开始挑战人类写代码了吗?
机器之心专栏作者:上海交通大学 APEX 实验室“Write the code. Change the world.”If computers can write code, then it is a new world.打造能自己写代码...
AIGC最新动态丨9月5日行业大汇总!
AIGC行业资讯国外热点速览OpenAI 将 Canva 插件引入 ChatGPT;Meta AI研究人员推出OCR神器Nougat;Epic Games Store将接受AI生成游戏内容;AI在线LOGO设计工...
MVDream:轻松实现从文本到3D渲染图像
近日,字节跳动研究人员推出了名为MVDream的新技术,它可以仅通过文本描述生成高质量的3D图像。这种从文本到图像的生成技术,被称为“文本到3D”技术,是当前计...
使用LLM构建AI Agents的正确姿势!ChatGPT作者博客全面总结
夕小瑶科技说 分享作者 | lilianweng来源 | 深度强化学习实验室 Lii’Log的博客以LLM(大语言模型)作为核心控制器构建智能体是一个很酷的概念。AutoGPT、GPT-...
700亿参数Llama 2训练加速195%!训练/微调/推理全流程方案开源,0代码一站解决
夕小瑶科技说 分享来源 | 新智元近日,全球规模最大的大模型开发工具与社区Colossal-AI,发布了全套Llama 2训练、微调、推理方案,可以为700亿参数模型的训练...
RLHF再也不需要人类了!谷歌团队研究证明,AI标注已达人类水平
新智元报道编辑:编辑部【新智元导读】ChatGPT横空出世后,RLHF成为研究人员关注的焦点。谷歌最新研究提出,不用人类标注,AI标注偏好后,也能取得与RLHF一样...
大模型爆发!百度智能云千帆2.0全面升级,讯飞星火正式开放
新智元报道编辑:好困【新智元导读】9月5日,百度智能云宣布千帆大模型平台实现2.0全面升级;同日,讯飞星火认知大模型面向全民开放。就在刚刚,百度智能云重...
混合精度下位置编码竟有大坑,llama 等主流开源模型纷纷中招!百川智能给出修复方案
作者 | 百川智能 位置编码技术是一种能够让神经网络建模句子中 Token 位置信息的技术。在 Transformer 大行其道的时代,由于 Attention 结构无法建模每个 tok...
传OpenAI秘密训练GPT-5;腾讯混元大模型或本周亮相;首个中英语音多模态LLM开源
09/04全球AIGC产业要闻1、Meta发布122种语言的机器阅读理解数据集2、Llama 2全流程解决方案开源 训练增速195%3、Inflection AI CEO:OpenAI正秘密训练GPT-54...
全球近 50 亿网民,正在成为 AI 内容的受害者
从兴趣到产业链上世纪末的作品《攻壳机动队》中,全身义体化的素子,怀疑自己是否仍然存在。身体、记忆和其他人的关系,当这些事物都能够被复制,也就无法成...
9.4丨AIGC大事日报
09/04全球AIGC产业要闻1、Meta发布122种语言的机器阅读理解数据集2、Llama 2全流程解决方案开源 训练增速195%3、Inflection AI CEO:OpenAI正秘密训练GPT-54...
AI「反腐」,德国马普所结合 NLP 和 DNN 开发抗蚀合金
By 超神经内容一览:在被不锈钢包围的世界中,我们可能都快忘记了腐蚀的存在。然而,腐蚀存在于生活中的方方面面。无论是锈迹斑斑的钢钉,老化漏液的电线,还...
大模型现存的10个问题和挑战
来源:Coggle数据科学大模型现存的问题和挑战这篇文章介绍了关于大型语言模型(LLMs)研究中的十个主要方向和问题:1. 减少和度量幻觉:幻觉指的是AI模型虚构...
大模型在智慧城市设计与运转中的核心作用
作者:张成文数字化、智能化产品、应用与创新,很大程度上受限于工具、模型、平台等软硬件基础设施的能力。智慧城市建设的顺利化程度、它最终表现出来的智慧...
700亿参数LLaMA2训练加速195%,开箱即用的8到512卡LLaMA2全流程方案来了!
明敏 发自 凹非寺量子位 | 公众号 QbitAILLaMA2训练微调推理,大提速了!针对700亿版本,训练加速195%。而且还能基于云平台实现无代码训练个性私有化模型,并...