标签:模型

MVDream:轻松实现从文本到3D渲染图像

近日,字节跳动研究人员推出了名为MVDream的新技术,它可以仅通过文本描述生成高质量的3D图像。这种从文本到图像的生成技术,被称为“文本到3D”技术,是当前计...
阅读原文

700亿参数Llama 2训练加速195%!训练/微调/推理全流程方案开源,0代码一站解决

夕小瑶科技说 分享来源 | 新智元近日,全球规模最大的大模型开发工具与社区Colossal-AI,发布了全套Llama 2训练、微调、推理方案,可以为700亿参数模型的训练...
阅读原文

使用LLM构建AI Agents的正确姿势!ChatGPT作者博客全面总结

夕小瑶科技说 分享作者 | lilianweng来源 | 深度强化学习实验室 Lii’Log的博客以LLM(大语言模型)作为核心控制器构建智能体是一个很酷的概念。AutoGPT、GPT-...
阅读原文

RLHF再也不需要人类了!谷歌团队研究证明,AI标注已达人类水平

新智元报道编辑:编辑部【新智元导读】ChatGPT横空出世后,RLHF成为研究人员关注的焦点。谷歌最新研究提出,不用人类标注,AI标注偏好后,也能取得与RLHF一样...
阅读原文

大模型爆发!百度智能云千帆2.0全面升级,讯飞星火正式开放

新智元报道编辑:好困【新智元导读】9月5日,百度智能云宣布千帆大模型平台实现2.0全面升级;同日,讯飞星火认知大模型面向全民开放。就在刚刚,百度智能云重...
阅读原文

混合精度下位置编码竟有大坑,llama 等主流开源模型纷纷中招!百川智能给出修复方案

作者 | 百川智能 位置编码技术是一种能够让神经网络建模句子中 Token 位置信息的技术。在 Transformer 大行其道的时代,由于 Attention 结构无法建模每个 tok...
阅读原文

传OpenAI秘密训练GPT-5;腾讯混元大模型或本周亮相;首个中英语音多模态LLM开源

09/04全球AIGC产业要闻1、Meta发布122种语言的机器阅读理解数据集2、Llama 2全流程解决方案开源 训练增速195%3、Inflection AI CEO:OpenAI正秘密训练GPT-54...
阅读原文

全球近 50 亿网民,正在成为 AI 成人内容的受害者

从兴趣到产业链上世纪末的作品《攻壳机动队》中,全身义体化的素子,怀疑自己是否仍然存在。身体、记忆和其他人的关系,当这些事物都能够被复制,也就无法成...
阅读原文

9.4丨AIGC大事日报

09/04全球AIGC产业要闻1、Meta发布122种语言的机器阅读理解数据集2、Llama 2全流程解决方案开源 训练增速195%3、Inflection AI CEO:OpenAI正秘密训练GPT-54...
阅读原文

AI「反腐」,德国马普所结合 NLP 和 DNN 开发抗蚀合金

By 超神经内容一览:在被不锈钢包围的世界中,我们可能都快忘记了腐蚀的存在。然而,腐蚀存在于生活中的方方面面。无论是锈迹斑斑的钢钉,老化漏液的电线,还...
阅读原文

大模型现存的10个问题和挑战

来源:Coggle数据科学大模型现存的问题和挑战这篇文章介绍了关于大型语言模型(LLMs)研究中的十个主要方向和问题:1. 减少和度量幻觉:幻觉指的是AI模型虚构...
阅读原文

大模型在智慧城市设计与运转中的核心作用

作者:张成文数字化、智能化产品、应用与创新,很大程度上受限于工具、模型、平台等软硬件基础设施的能力。智慧城市建设的顺利化程度、它最终表现出来的智慧...
阅读原文

700亿参数LLaMA2训练加速195%,开箱即用的8到512卡LLaMA2全流程方案来了!

明敏 发自 凹非寺量子位 | 公众号 QbitAILLaMA2训练微调推理,大提速了!针对700亿版本,训练加速195%。而且还能基于云平台实现无代码训练个性私有化模型,并...
阅读原文

AIGC最新动态丨9月4日行业大事件汇总!

AIGC行业资讯国外热点速览全球大型网站正在阻止 OpenAI 等人工智能爬虫访问其内容;三星注册“Samsung Gauss”商标 或为即将推出的生成式AI平台;马斯克称将用X数...
阅读原文

X(推特)调整隐私政策,马斯克将用户发布的信息训练 AI 模型

据报道,埃隆・马斯克旗下社交平台 X(推特)日前调整了隐私政策,允许 X 使用用户发布的信息来训练其人工智能(AI)模型。新的隐私政策将于 9 月 29 日生效...
阅读原文