标签:数据
ECCV 2024 | 引入DiT的原生3D通用框架,适用任意神经场、秒级生成
AIxiv专栏是机器之心发布学术、技术内容的栏目。过去数年,机器之心AIxiv专栏接收报道了2000多篇内容,覆盖全球各大高校与企业的顶级实验室,有效促进了学术...
Meta浙大校友让评估模型「自学成才」,数据全合成无需人工标注,训练Llama 3 70B超过405B
新智元报道编辑:乔杨 【新智元导读】随着LLM不断迭代,偏好和评估数据中大量的人工标注逐渐成为模型扩展的显著障碍之一。Meta FAIR的团队最近提出了一种使用...
李沐:大模型发展趋势与个人职业选择
生成式AI时代最火AI芯片峰会下月来袭!9月6-7日,智猩猩发起主办的2024全球AI芯片峰会将在北京盛大举行。峰会设有开幕式、数据中心AI芯片专场、边缘/端侧AI芯...
Transformer作者预警:只卖模型玩不过OpenAI!
来源:量子位 | 公众号 QbitAI叨乐 发自 凹非寺 Transformer八子中最年轻的Aidan Gomez在最新的采访中感叹: 只卖模型真的不赚钱! 谷歌版的Aidan Gomez,是...
李沐重返母校上海交大,从LLM聊到个人生涯,这里是演讲全文
机器之心报道 机器之心编辑部昨天,李沐回到了母校上海交大,做了一场关于 LLM 和个人生涯的分享。本文是机器之心梳理的李沐演讲内容(根据 B 站用户@考拉klk...
从拨号上网到创立估值55亿美元独角兽,Transformer作者万字访谈聊AI趋势
机器之心报道 机器之心编辑部除了扩大模型规模,AI 公司还有其他路可以走吗?只靠模型 API 赚不到钱了怎么办?Aidan Gomez 在访谈中谈到了目前困扰 AI 公司的...
MiniMax 基于 Apache Doris 升级日志系统,PB 数据秒级查询响应技术实践
作者|MiniMax 基础架构研发工程师 Koyomi、香克斯、Tinker 导读:早期 MiniMax 基于 Grafana Loki 构建了日志系统,在资源消耗、写入性能及系统稳定性上都面...
哎呀,我们“挂了”!——这是能说的吗?| 直播预告
近年来,多家知名互联网公司遭遇的软件系统故障,导致服务中断、数据丢失,这不仅影响了用户体验,甚至给企业带来直接或间接的经济损失。这些事件促使整个行...
大模型 VS 小模型
生成式AI时代最火AI芯片峰会下月来袭!9月6-7日,智猩猩发起主办的2024全球AI芯片峰会将在北京盛大举行。峰会设有开幕式、数据中心AI芯片专场、边缘/端侧AI芯...
微软如何完成AI转型?微软中国CTO韦青亲述:我们需要的不是一个无所不知的模型
出品|InfoQ 《大模型领航者》 访谈主持|霍太稳,极客邦科技创始人兼 CEO 访谈嘉宾|韦青,微软中国首席技术官 作者|褚杏娟 “Satya 刚上任 CEO 时,就跟微...
总说具身智能的数据太贵,鹏城实验室开源百万规模标准化数据集
AIxiv专栏是机器之心发布学术、技术内容的栏目。过去数年,机器之心AIxiv专栏接收报道了2000多篇内容,覆盖全球各大高校与企业的顶级实验室,有效促进了学术...
超6亿!文心大模型日调用量半年增长超10倍,AI成百度最强加速引擎
杰西卡 鱼羊 发自 凹非寺量子位 | 公众号 QbitAI大模型进入“应用爆发元年”,落地再次成为AI竞速关键词。 现在,阶段性成绩单随着头部企业Q2财报的公布逐渐明...
一键下载Meta最大视频分割数据集!含50.9K真实世界视频,覆盖47个国家
作者:十九 编辑:李宝珠 Meta 近日开源了 SAM 2 模型,只需要在视频帧上输入提示(点击、框或掩码),就能精准识别并分割图像或视频中的任何对象,用于训练 ...
突破万字长文输出瓶颈!清华大学开源 LongWriter-6k 数据集;7 个 CCF A 类顶会即将截稿
当前的长上下文大模型虽能处理海量文本的输入,但由于长输出示例的匮乏,使其在生成长篇内容时却力不从心。为解决这个问题,清华大学的研究团队构建了 LongWr...