标签:模型
高效能不等于开发快,大模型时代如何正确提升研发效能?
采访嘉宾 | 肖然 编辑 | 凌敏 从最初的敏捷软件开发方法到 DevOps 成熟度模型,研发效能的发展历程经过多个阶段。如今,基于大模型的 AIGC 技术正在催生软件...
多模态大模型综述:从专家到通用助手
文章转载自量子位,Founder Park 有所调整。多模态大模型最全综述来了!由微软 7 位华人研究员撰写,足足 119 页——它从目前已经完善的和还处于最前沿的两类多...
顶尖科学家如何玩转AI?DeepSpeed4Science:利用先进的AI系统优化技术实现科学发现
新智元报道编辑:LRS 好困【新智元导读】AI助力科学发现,DeepSpeed4Science计划引领新时代技术突破!在接下来的十年中,深度学习可能会彻底改变自然科学,增...
不要沦为大模型应用的“炮灰”
作者|褚杏娟“虽然在 2012 年到 2015 年间,深度学习在图像识别领域获得了巨大成功,但要达到通用人工智能,还需要时间。”这是读研究生时刘小洋的老教授告诉...
Chinchilla之死:只要训练足够长时间,小模型也能超过大模型
选自espadrine机器之心编译2022 年 3 月,DeepMind 一篇论文《Training Compute-Optimal Large Language Models》通过构建的 Chinchilla 模型得出了一个结论...
如何评估大语言模型是否可信?这里总结了七大维度
机器之心发布作者:刘扬,Kevin Yao本文提出 7 个主要关键维度来全面评估 LLM 可信度。实际部署中,如何 “对齐”(alignment)大型语言模型(LLM,Large Langu...
AI 模拟《漫长的季节》角色唱歌
大数据文摘受权转载自陈东泽最近,自研了一个 AI 模型叫 TalkSVS,能根据人们说话的声音,去模拟其唱歌。举个例子,电视剧《漫长的季节》,台词白话。这个模...
语言模型有重大缺陷,知识推演竟然是老大难
来源:机器之心惊人发现:大模型在知识推演上存在严重缺陷。灵活运用知识是智慧的关键。人脑可以快速处理知识,如快速回答 “《静夜思》中有几个月字”。那么,...
【人工智能】美智库建议利用生成式人工智能提升决策优势
往期回顾简介近期,美国防务智库特别竞争研究项目(Special Competitive Studies Project)发布了一份《生成式人工智能:未来创新的力量》文件,文件认为美国国...
华为中秋节给员工发Mate60手机;商汤科技回应原知产总监被立案侦查;马斯克平均年终奖33亿元 | AI一周资讯
整理 | 凌敏 第四范式港股上市;微软发布 Windows 11 重大更新,包含 Copilot 和 AI 驱动画图工具;阿里分拆菜鸟独立上市;台积电 AI 芯片将涨价;抖音推出闪...
真实性惊人,谷歌、康奈尔提出真实的图像补全技术RealFill
机器之心报道编辑:XW得到一张好看的照片越来越容易了。假期出游,肯定少不了拍照留念。不过,大部分在景区拍摄的照片或多或少都有些遗憾,背景里不是多了些...
小扎元宇宙1小时「真人对谈」载入史册!13个月超进化,表情模拟2.0,连头发丝都根根分明
新智元报道编辑:桃子 润【新智元导读】《头号玩家》的世界近在咫尺!周末,小扎在元宇宙开启了1小时「真人对谈」,让主播感慨差点忘记眼前的人竟不是真人。...
雷军王小川牵手,小米大模型投资布局首次曝光
衡宇 发自 凹非寺量子位 | 公众号 QbitAI大模型时代,雷军和王小川走到了一起。量子位最新获悉,王小川旗下的创业公司百川智能,已经成为雷军大模型布局中的...
贾佳亚韩松团队新作:两行代码让大模型上下文窗口倍增 | GitHub热榜
克雷西 发自 凹非寺量子位 | 公众号 QbitAI只要两行代码+11个小时微调,就能把大模型4k的窗口长度提高到32k。规模上,最长可以扩展到10万token,一口气就能读...
Meta官方博客:开源模型Llama的生态是怎样的?
本文来源于 Meta AI 官方博客,作者 Meta AI 产品总监Joe Spisak 和工程总监Sergey Edunov。原文链接:https://ai.meta.com/blog/llama-2-updates-connect-20...