标签:数据

AI作曲缺数据,浙大GTSinger数据集上线:适配所有歌声任务、带有真实乐谱

AIxiv专栏是机器之心发布学术、技术内容的栏目。过去数年,机器之心AIxiv专栏接收报道了2000多篇内容,覆盖全球各大高校与企业的顶级实验室,有效促进了学术...
阅读原文

Cursor 爆火背后:大模型如何革新应用开发流程、重塑技术边界?

编辑 | 蔡芳芳 策划 | 李忠良 人工智能应用开发正在逐步成为各行业的核心创新驱动力,CUI 式的对话助手、串联业务流程的 Agent 或是内嵌在原有业务逻辑中的 ...
阅读原文

大模型「强崩溃」!Meta新作:合成数据有「剧毒」,1%即成LLM杀手

新智元报道编辑:乔杨桃子 【新智元导读】1%合成数据,就能让模型瞬间崩溃!来自Meta、NYU等机构团队证实,「微量」合成数据便让LLM弱不可堪。甚至,参数规模...
阅读原文

苹果多模态模型大升级!文本密集、多图理解,全能小钢炮

新智元报道编辑:alan 【新智元导读】近日,一向画风精致的「苹果牌AI」,也推出了升级版的多模态大模型,从1B到30B参数,涵盖密集和专家混合模型,密集文本...
阅读原文

从图像到视频:浅谈Video Diffusion Models背后的底层原理

01前言最近一段时间恰好在推进手上的一个做视频生成相关的课‍‍题,也是对视频扩散模型(Video Diffusion Models)这一领域有了颇多认识。其中,视频扩散模型...
阅读原文

Science:一堆看似杂乱无章的细胞如何形成坚固的胚胎

胚胎发育始于单个卵细胞受精并开始不断分裂。胚胎最初是一个混乱的簇,逐渐演变成高度有序的结构。科学家现在对这一过程有了新的见解,强调了混乱和秩序都至...
阅读原文

清华校友用AI破解162个高数定理,智能体LeanAgent攻克困扰陶哲轩难题!

新智元报道编辑:编辑部 HYZ 【新智元导读】就在刚刚,清华校友用AI证明了162个未被人类证明的数学定理,解决了AI无法解决陶哲轩对多项式Freiman-Ruzsa猜想的...
阅读原文

5.2k星!突破 OCR 困境的超级变革者来了;多语言医疗大模型开源,语料库和基准数据集已提供下载

在当今数字化进程飞速发展的时代,OCR(光学字符识别)技术虽已普及,但仍存在诸多瓶颈。传统 OCR 模型在面对复杂多变的情况时,识别准确率会大打折扣,且处...
阅读原文

国产AI模型登顶全球TOP 1!智源BGE下载破亿成Hugging Face月榜冠军,RAG「瑞士军刀」破纪录

新智元报道编辑:编辑部 HYZ 【新智元导读】国产首个AI模型登顶Hugging Face月榜冠军!发布短短一年,BGE模型总下载量破数亿,位居国产TOP 1。如今,它在开源...
阅读原文

国产模型首开Hugging Face月度下载全球第一,智源BGE累计下载逾亿

机器之心发布 机器之心编辑部近日,Hugging Face更新了月度榜单,智源研究院的BGE模型登顶榜首,这是中国国产AI模型首次成为Hugging Face月榜冠军。BGE在短短...
阅读原文

国家海洋环境预报中心李本霞:全国首个海浪智能预报系统已投入业务化运行,AI助力海浪预报多项突破

作者:李本霞 编辑:田小幺,十九,李宝珠 国家海洋环境预报中心海浪预报室主任李本霞在第六届海洋数值预报与高性能计算论坛中,深入探讨了 AI 技术在海浪预...
阅读原文

Lex Fridman对谈Cursor团队:真正找到PMF的AI编程产品,有信心取代Copilot

Cursor 最近很火,甚至被认为可能是取代 VS Code 的下一代代码编辑器。 Cursor 一开始就没有把自己定位在 Copilot 的角色上,团队认为,大模型会颠覆软件的开...
阅读原文

一年过去,登上第一期a16z榜单的文生图产品们都怎样了?

去年十一期间,我们推出了选题《全球流量Top50的“AI网站”出炉:C端用户都愿意用AI干什么?》,基于第一期 a16z Top50 AI 网站的榜单,盘点了各类别网站的流量...
阅读原文

2024年大模型Alignment偏好优化技术:从PPO, SPO到MCTS-DPO

文章转载自公众号:极市平台,本文只做学术/技术分享,如有侵权,联系删文。 导读本文讨论了2024年大模型Alignment偏好优化技术的发展,包括从PPO、SPO到MCTS...
阅读原文

爆火AI编程应用何以单挑微软?Cursor团队2小时访谈揭秘

本次对话非常技术化,讨论的范围远远超出一个代码编辑器。 编译|尹明顺 吴浪娜 编辑|漠影 智东西10月10日消息,当地时间10月7日,知名播客主持人Lex Fridman...
阅读原文
1234117