标签:数据
Nature 封面:AI 改变科学的多种方式,无论是好是坏
将 ScienceAI设为星标第一时间掌握新鲜的 AI for Science 资讯编辑 | 绿萝人工智能(AI)涉及的研究领域不断增加。从蛋白质折叠到天气预报,从医学诊断到科学...
背诵不等于理解,深度解析大模型背后的知识储存与提取
机器之心专栏机器之心编辑部自然语言模型的背诵 (memorization) 并不等于理解。即使模型能完整记住所有数据,也可能无法通过微调 (finetune) 提取这些知识,...
办公党、学生党福音!30秒用文档、甚至一句话“造”出PPT,万字长文一键读懂
AI原生时代:百度文库正在为用户提供一站式文档编辑、创作、管理平台。作者|程茜编辑|漠影大学结课作业、工作项目汇报……都离不开PPT制作。但你有测算过自己完...
马毅团队新作!微调多模态大模型会「灾难性遗忘」,让性能大减
新智元报道编辑:桃子 好困【新智元导读】马毅教授团队最新研究表明,微调多模态大语言模型(MLLM)将会导致灾难性遗忘。模型灾难性遗忘,成为当前一个关键热...
让大模型触手可及,言犀 AI 开发计算平台上线
机器之心报道作者:Esther大模型爆火的一年中,生成式 AI 行业最重要的发展瓶颈出现在算力侧。9 月 20 日,红杉美国在文章《生成式 AI 的第二幕》提到,许多...
复旦大学团队发布中文智慧法律系统DISC-LawLLM,构建司法评测基准,开源30万微调数据
机器之心专栏作者:FudanDISC随着智慧司法的兴起,智能化方法驱动的智能法律系统有望惠及不同群体。例如,为法律专业人员减轻文书工作,为普通民众提供法律咨...
大模型要落地产业,提高性价比是关键|甲子光年
“对京东来说,技术永远只是手段,而不是目的。”作者|刘杨楠编辑|栗子过去半年,如果要问:训练一个大模型需要几步?你可能会得到两种答案。一种是“找人、买...
InfoQ 2023 年趋势报告:数据工程、AI 和 ML
作者 | Roland Meertens、Srini Penchikala、Sherin Thomas译者 | 刘雅梦策划 | 丁晓昀InfoQ 趋势报告为 InfoQ 读者提供了一个关于我们认为架构师和技术领导...
NeurIPS 2023 | 扩散模型解决多任务强化学习问题
来源:PaperWeekly作者:何浩然单位:上海AI Lab 上海交大APEX实验室研究方向:Embodied AI、强化学习扩散模型(diffusion model)在 CV 领域甚至 NLP 领域都...
大数据日志分析值 2000 亿?从思科收购 Splunk 说开去
作者 | Tina9 月 21 日,思科公司表示,将以每股 157 美元的价格收购网络安全软件厂商 Splunk。这笔现金交易总值约 280 亿美元(折合约 2047 亿元人民币),...
国内大模型数据之困有解了!头部标注厂商打造,专为垂直行业落地
白交 发自 凹非寺量子位 | 公众号 QbitAI大模型落地垂直行业,数据已打响第一枪。现在,专门面向垂直大模型的数据解决方案来了——直接帮助通用大模型产业落地...
阿里140亿大模型开源!10项任务超340亿Llama 2,Demo在线可玩
萧箫 发自 凹非寺量子位 | 公众号 QbitAI阿里又开源大模型了!这次是纯粹的大语言模型,相比上一次的70亿,新模型的参数量来到了140亿。它名叫Qwen-14B,一上...
望繁信科技:首创流程资产,打造流程挖掘中国范式|甲子光年
不做中国版Celonis,只做唯一的望繁信科技。作者|陈杨编辑|栗子“从流程驱动转向数据驱动,我觉得这是一个伪命题。”望繁信科技创始人、CEO索强的话着实令「...
生成式人工智能的基本构建模块
图文|Jonathan Shriftman翻译|匡萃彪译者注:以下是原文的翻译。该文讨论了生成式人工智能领域的关键组成部分、新兴趋势和早期推动创新的公司。作者提到了...
本周TOP AI论文(9月18日-9月24日)
图|匡萃彪文|匡萃彪摘要- 验证链(CoVe)减少LLMs中的幻觉- 语言建模就是压缩- LongLoRA:高效微调长上下文大语言模型 🇨🇳- 对比解码改善大型语言模型的推理能...