标签：模型

PyTorch造大模型“加速包”，不到1000行代码提速10倍！英伟达科学家：minGPT以来最好的教程式repo之一

西风发自凹非寺量子位 | 公众号 QbitAIPyTorch团队让大模型推理速度加快了10倍。且只用了不到1000行的纯原生PyTorch代码！项目名为GPT-fast，加速效果观感...

阅读原文

AIGC动态

3年前 (2023)

追踪溯源？可定位源头模型的AI文本判别器出现了！CMU提出

夕小瑶科技说原创作者 | 智商掉了一地、Python自从去年底 ChatGPT 发布以来，许多人的工作和生活方式随之变化。作为创作时代的重要拐点，大型语言模型（LLM...

阅读原文

AIGC动态

3年前 (2023)

微软教小模型推理进阶版：Orca 2性能媲美10倍参数模型，已开源

机器之心报道机器之心编辑部站在巨人的肩膀上会让你看的更远，而通过让大规模语言模型来「教」较小规模的语言模型进行推理，也会是事半功倍的效果。如你我所...

阅读原文

AIGC动态

3年前 (2023)

线上闭门会上新！北航、MIT、莫纳什和商汤四位专家直播探讨大模型微调与推理部署

今年9月起，智东西公开课品牌全新升级为智猩猩。智猩猩定位硬科技讲解与服务平台，提供公开课、在线研讨会、讲座、线上闭门会、峰会等线上线下产品。「线上闭...

阅读原文

AIGC动态

3年前 (2023)

通义千问720亿参数大模型开源；Meta发布多模态感知数据集；昆仑万维发布Agent开发平台丨AIGC大事日报

12/01全球AIGC产业要闻1、Meta开源实时翻译系列模型Seamless2、Meta推出音频生成模型Audiobox3、Meta发布多模态数据集Ego-Exo4D4、阿里云通义千问开源720亿参...

阅读原文

AIGC动态

3年前 (2023)

AI美术完成度超80%，游戏模型为何无法通用？三七互娱独家揭秘

量子位智库发自凹非寺量子位 | 公众号 QbitAI*本文为量子位智库「AIGC+游戏」系列深度访谈栏目，更多内容请关注即将发布的「AIGC游戏产业全景报告」：。AIG...

阅读原文

AIGC动态

3年前 (2023)

AI诊疗或更准确，来自顶刊新研究！大模型搞医疗现状：在CPU上成功落地

金磊明敏发自凹非寺量子位 | 公众号 QbitAI当大模型踏入医疗行业与人类医生一较高下时，它能达到什么水平？就在最近，医学顶刊BMJ便给出了这样一个结论：...

阅读原文

AIGC动态

3年前 (2023)

国产720亿参数开源免费模型来了！对标Llama2 70B，一手实测在此

鱼羊发自凹非寺量子位 | 公众号 QbitAI最强开源大模型，再次易主！就在刚刚，阿里云通义千问又双叒开源了，并且直接开大：甩出了720亿参数版本——在中国的开...

阅读原文

AIGC动态

3年前 (2023)

昆仑万维方汉：大模型时代，超级 APP 不会是神话

未来，超级APP不是一个，而是多个。作者丨何思思编辑丨陈彩娴“艰苦奋斗，独立自主”——这是昆仑万维董事长兼CEO方汉做大模型3年以来的真实感受。早在今年4月，...

阅读原文

AIGC动态

3年前 (2023)

人工智能基础创新的第二增长曲线

来源：微软亚洲研究院作者：韦福如编者按：2023年是微软亚洲研究院建院25周年。借此机会，我们特别策划了“智启未来”系列文章，邀请到微软亚洲研究院不同研究...

阅读原文

AIGC动态

3年前 (2023)

AI 视频明星公司 Heygen 收入突破 1800 万美元，公司估值 7500 万美元

因为泰勒·斯威夫特说中文的视频而备受更关注的 AI 视频生成工具 Heygen，后，11 月份该项收入飙升到了 1800 万美元。而且，在收到一笔最新的 560 万美元风险...

阅读原文

AIGC动态

3年前 (2023)

通义千问爆甩开源全家桶！最强720亿参数超车Llama 2，新上视觉模型看图直出代码

新智元报道编辑：编辑部【新智元导读】通义千问开源全家桶正式上线！业界最强72B模型直接超越开源标杆Llama 2-70B，还有1.8B模型、音频大模型全部开源，阿里...

阅读原文

AIGC动态

3年前 (2023)

GPT-4合成！「角色调节」让大模型轻松越狱，成功率暴涨40%，成本不到14元，马库斯转赞

新智元报道编辑：桃子【新智元导读】让大模型洗钱、制造炸弹、合成冰毒？GPT-4、 Claude 2纷纷沦陷了。让大模型成功越狱，还是有机可乘。最近，研究人员研制...

阅读原文

AIGC动态

3年前 (2023)

LLM生成延迟降低50%！DeepSpeed团队发布FastGen：动态SplitFuse技术，提升2.3倍有效吞吐量

新智元报道编辑：LRS【新智元导读】DeepSpeed-FastGen结合MII和DeepSpeed-Inference实现LLM高吞吐量文本生成。GPT-4和LLaMA这样的大型语言模型（LLMs）已在各...

阅读原文

AIGC动态

3年前 (2023)

OpenAI最强竞品训练AI拆解LLM黑箱，意外窥见大模型「灵魂」

新智元报道编辑：润【新智元导读】Anthropic的模型可解释性团队，从大模型中看到了它的「灵魂」——一个可解释的更高级的模型。为了拆开大模型的「黑箱」，Anth...

阅读原文

AIGC动态

3年前 (2023)

1…391 392393394 395…483