标签:模型

港科大在读博士刘兆洋:从 InternGPT 到 ControlLLM,基于大语言模型的多模态理解与生成能力构建

1月17日晚7点,智猩猩推出「多模态大模型线上闭门会」。本次闭门会由阿里巴巴通义实验室 NLP 高级算法专家严明参与出品,并聚焦于大语言模型工具调用 Control...
阅读原文

中国今年冲出了6家AIGC独角兽!清华校友占据其三

夕小瑶科技说 原创作者 | 小戏、王二狗时间拉回到 2023 年初。 GPT-4 还没有问世,但是 22 年底的 ChatGPT 已经给了世界一个巨大的惊喜,那天 OpenAI CEO Sam...
阅读原文

字节最新文生视频模型,引发围观!狐狸跳舞超丝滑,效果超Gen-2

夕小瑶科技说 原创作者 | 谢年年、python扩散模型带动了文生视频领域的发展。Runway、Pika 1.0、Morph、Moon Valley和Stable Video Diffusion model等模型在...
阅读原文

今日最佳NLP论文推荐:颠覆性Prompt-tuning新法

夕小瑶科技说 原创作者 | 赛博马良本文内容由 赛博马良「AI论文解读达人」 智能体生成,人工整理排版。 「AI论文解读达人」 可提供最热AI论文推荐、论文解读...
阅读原文

拆掉英伟达护城河,细节曝光!世界最快超算用3072块AMD GPU训完超万亿参数LLM

新智元报道编辑:润 好困 【新智元导读】世界上最快超算集群Frontier,用8%的GPU训练出了一个万亿级规模的大模型,而且是在AMD硬件平台之上完成。研究人员将...
阅读原文

吵了一年,我来下个结论:纯向量数据库和向量插件都没有未来!

作者 | 张颖峰 导读:向量数据库的争议差不多一年了,但我们一直缺少一篇能透彻讲解向量数据库相关问题的文章,这导致在这个领域的讨论一直没有得到充分的澄...
阅读原文

大模型恋爱神器!16种MBTI定制,北大ChatLaw团队出品

Jiaxi 投稿自 凹非寺量子位 | 公众号 QbitAI北大团队新作,让大模型拥有个性! 而且还是自定义那种,16种MBTI都能选。 这样一来,即便是同一个大模型,不同性...
阅读原文

《西游记》把大模型给难倒了

衡宇 发自 凹非寺量子位 | 公众号 QbitAI问:《西游记》里,总共提到过孙悟空这只猴多少次? 咱问了问ChatGPT,ChatGPT连连摇头,说《西游记》篇幅太长,它统...
阅读原文

如何高效部署大模型?CMU最新万字综述纵览LLM推理MLSys优化技术

机器之心专栏 机器之心编辑部近日,CMU Catalyst 团队推出了一篇关于高效 LLM 推理的综述,覆盖了 300 余篇相关论文,从 MLSys 的研究视角介绍了算法创新和系...
阅读原文

Meta光速下架的模型Galactica,上交大用它构建地球科学大模型

将 ScienceAI设为星标 第一时间掌握 新鲜的 AI for Science 资讯编辑 | Z 2022年10月30日,ChatGPT的横空出世,仅用几天的时间就改变了包括学术界在内的各行...
阅读原文

总结!大模型微调(Tuning)的常见方法

直播预告 | 1月17日晚7点,「多模态大模型线上闭门会」正式开讲!阿里巴巴通义实验室 NLP 高级算法专家严明参与出品,携手刘兆洋、李彦玮、文束三位青年学者...
阅读原文

在 AI 时代称王还是被取代?关于 Canva 的八个思考

创意软件因其工作流壁垒深、能积累客户资产、与 AI 结合潜力大而被市场视作大模型时代的受益者,Adobe 股价在 2023 年上涨了接近一倍,主要由估值倍数的回升...
阅读原文

实测OPPO大模型手机:路人甲一抹就没,电话粥一键总结

明敏 发自 凹非寺量子位 | 公众号 QbitAI都说2024会是AI Agent元年,杀手级应用将要出现。 但就在开年,已经看到不一样的思路。 与其做单个Agent应用,不如把...
阅读原文

字节让达芬奇和蒙娜丽莎“隔空吵架”,只需一张图、一段音频、一个情感片段

允中 发自 凹非寺量子位 | 公众号 QbitAIAIGC在视频生成领域展现出非凡的潜力。近期, 字节跳动智能创作团队和得克萨斯大学达拉斯分校又提出了一项名为DREAM-...
阅读原文

首个国产开源MoE大模型来了!性能媲美Llama 2-7B,计算量降低60%

克雷西 发自 凹非寺量子位 | 公众号 QbitAI开源MoE模型,终于迎来首位国产选手! 它的表现完全不输给密集的Llama 2-7B模型,计算量却仅有40%。 这个模型堪称1...
阅读原文