标签:数据

仅需200M参数,零样本性能超越有监督!谷歌发布时序预测基础模型TimesFM

新智元报道编辑:LRS 【新智元导读】TimesFM针对时序数据设计,输出序列长于输入序列,在1000亿时间点数据进行预训练后,仅用200M参数量就展现出超强零样本学...
阅读原文

苹果大模型MM1杀入场:300亿参数、多模态、MoE架构,超半数作者是华人

机器之心报道 机器之心编辑部苹果也在搞自己的大型多模态基础模型,未来会不会基于该模型推出相应的文生图产品呢?我们拭目以待。 今年以来,苹果显然已经加...
阅读原文

Sora竟是用这些数据训练的?OpenAI CTO坦白惹众怒

机器之心报道 机器之心编辑部采访首次揭示出 Sora「有所为(比如,将生成效果逼向极限)」和「有所为不为(比如短期内不开放、不生成公众人物)」背后的深层...
阅读原文

Claude 3大模型引起学界关注,业内人士:或将开启科研新范式

来源:DeepTech深科技 破解量子算法、破译古老语言、用几个小时给出科学家花费数月才能得到的研究方案……自 AI 初创公司 Anthropic 于太平洋时间 2024 年 3 月...
阅读原文

首次攻克「图基础模型」三大难题!港大开源OpenGraph:零样本学习适配多种下游任

新智元报道编辑:LRS 【新智元导读】港大发布通用图基座模型OpenGraph,巧妙从LLM中蒸馏零样本图泛化能力。图学习(Graph Learning)技术能够对复杂的关系数...
阅读原文

对比近期发布的几个小模型,sLLM的天花板在哪里?

智猩猩与智东西将于4月18-19日在北京共同举办2024中国生成式AI大会,阿里巴巴通义千问大模型技术负责人周畅,潞晨科技创始人尤洋,生数科技CEO唐家渝,优必选...
阅读原文

让Sora和ChatGPT更可靠!只需这个知识价值定量评估新框架

西风 发自 凹非寺量子位 | 公众号 QbitAI为了让AI更像科学家,他们将人类知识注入大模型… 正如教孩子解难题,你可以让他们自己反复试错找到正确方法,也可以...
阅读原文

LLaMA-2-7B数学能力上限已达97.7%?Xwin-Math利用合成数据解锁潜力

机器之心专栏 机器之心编辑部合成数据持续解锁大模型的数学推理潜力!数学问题解决能力一直被视为衡量语言模型智能水平的重要指标。通常只有规模极大的模型或...
阅读原文

数学问题难解?新研究提出MathScale方法,让AI更懂数学推理

夕小瑶科技说 原创编辑 | 松果 引言:数学问题解决中的语言模型挑战数学问题解决是一个复杂的认知过程,它要求参与者不仅要掌握数学知识,还要能够进行多步骤...
阅读原文

LLM将成历史?开源bGPT或颠覆深度学习范式:直接模拟二进制,开启模拟数字世界新纪元!

新智元报道编辑:LRS 【新智元导读】新模型bGPT是一个基于字节的Transformer模型,能够将不同类型的数据纳入同一框架之下,可以生成文本、图像和音频,还能模...
阅读原文

仅需格式转换提升9%数学推理能力,上交开源新对齐方法ReAlign

Pengfei 投稿量子位 | 公众号 QbitAI大模型对齐新方法,让数学推理能力直接提升9%。 上海交通大学生成式人工智能实验室(GAIR Lab)新成果ReAlign,现已开源...
阅读原文

OpenAI 投资的机器人公司高管:具身智能会像 ChatGPT 一样突然到来

2022 年,谷歌高级研究科学家 Eric Jang 离开 Google Robotics,以副总裁的身份加入 1X Technologies 负责 AI 工作。2023 年 3 月,1X 获得了一轮由 OpenAI ...
阅读原文

OpenAI Sora 团队专访:技术细节、后续功能开发排期全解密!

。3 月 8 日,OpenAI 的 Sora 团队接受了油管知名博主 Marques Brownlee (简称 MKBHD) 的采访,透露了很多之前从未公开的信息,比如正式上线时间、什么时候加...
阅读原文

Midjourney控诉Stability AI偷作品还搞崩了服务器!曝光后Stability AI CEO 紧急回应

整理|冬梅、核子可乐Stability AI 公司 CEO Emad Mostaque 表示正在调查具体情况。 最近,生成式 AI 创业公司 Midjourney 经历了 24 小时宕机,服务器因长时...
阅读原文

宁德核电推出全球参数量最大的核工业大模型|InfoQ 独家

作者 |罗燕珊 核电行业是工业场景中相对复杂、安全性能要求极高的场景。如果AI大模型在如此复杂的场景中被验证可行,其经验将为该技术在其他工业领域的应用带...
阅读原文
17475767778126