标签:数据

抱抱脸Open了OpenAI的秘密武器,网易参与复现

西风 发自 凹非寺量子位 | 公众号 QbitAIOpenAI的秘密武器、ChatGPT背后功臣RLHF,被开源了。 来自Hugging Face、加拿大蒙特利尔Mila研究所、网易伏羲AI Lab...
阅读原文

大型科技公司购买人工智能训练数据的地下竞赛

点击上方蓝字关注我们“大型科技公司正在进行一场秘密的人工智能训练数据收购竞赛。这些公司正在疯狂地收购各种类型的数据,以训练更强大的AI系统,从而获得市场...
阅读原文

科技巨头如何为了发展人工智能而采取捷径收集数据

点击上方蓝字关注我们“科技巨头正在大规模收集用户数据,用于训练人工智能系统。这些公司利用用户的网络活动、位置信息和其他个人数据,开发出更加智能和个性化...
阅读原文

学术不端!124页调查报告终结Dias室温超导闹剧

海归学者发起的公益学术平台 分享信息,整合资源 交流学术,偶尔风月 2020年10月14日,物理学家兰加·迪亚斯(Ranga Dias)在Nature发表了论文,声称他构建出...
阅读原文

谷歌DeepMind发布Gecko:专攻检索,与大7倍模型相抗衡

机器之心报道 编辑:陈萍Gecko 是一种通用的文本嵌入模型,可用于训练包括文档检索、语义相似度和分类等各种任务。 文本嵌入模型在自然语言处理中扮演着重要...
阅读原文

Scaling Law 又一次性感了吗?

专题解读 事件:Sora 的出现被认为是 Scaling Law 的又一次成功,这也引起了社区中更多对 Scaling Law 的讨论。 自 OpenAI 发布 Sora,业界对该模型的能力及...
阅读原文

二次元专用超分AI模型APISR:在线可用,入选CVPR

机器之心报道 编辑:Panda《龙珠》、《神奇宝贝》、《新世纪福音战士》等上个世纪开播的动漫是很多人童年回忆的一部分,它们曾给我们带来了充满了热血、友情...
阅读原文

你的自拍和记录,正被硅谷大厂砸数十亿美元疯抢!

新智元报道编辑:Aeneas 好困 【新智元导读】2026年的数据荒越来越近,硅谷大厂们已经为AI训练数据抢疯了!它们纷纷豪掷十数亿美元,希望把犄角旮旯里的照片...
阅读原文

中科大发布Agent-FLAN,微调提升Agent能力

夕小瑶科技说 原创作者 | 松果 引言:探索大型语言模型作为智能代理的挑战与机遇随着大语言模型(LLMs)在各种自然语言处理任务中取得巨大成功,将这些模型作...
阅读原文

超全大模型资源汇总|30 个优质 NLP 数据集和模型,一键使用 8 个 demo,建议收藏!

近两年来,大模型的热度持续高涨,并且开始在更广泛的领域进行落地探索。随着行业整体的快速发展,越来越多的开源大模型涌入市场,进一步推动了上层应用的拓...
阅读原文

复旦MOSS团队:数据配比的scalinglaw

智猩猩与智东西将于4月18-19日在北京共同举办2024中国生成式AI大会,爱诗科技创始人王长虎,启明创投合伙人周志峰,Open-Sora开发团队潞晨科技创始人尤洋,「...
阅读原文

CVPR 2024满分论文|英伟达开源大模型FoundationPose称霸BOP排行榜

新智元报道编辑:LRS 【新智元导读】FoundationPose模型使用RGBD图像对新颖物体进行姿态估计和跟踪,支持基于模型和无模型设置,在多个公共数据集上大幅优于...
阅读原文

GPT-5红队测试邮件曝光,最早6月发布?网友在线逼问Altman,数十亿美元超算26年启动

新智元报道编辑:Aeneas 桃子 【新智元导读】今天,陆续有网友晒出OpenAI发给自己的红队邀请邮件,看起来,GPT-5已经进入红队测试了?网友们纷纷展开畅想,对...
阅读原文

10万美元训出Llama-2级大模型!全华人打造新型MoE,贾扬清SD前CEO围观

丰色 发自 凹非寺量子位 | 公众号 QbitAI“只需”10万美元,训练Llama-2级别的大模型。 尺寸更小但性能不减的MoE模型来了: 它叫JetMoE,来自MIT、普林斯顿等研...
阅读原文

AI无人商店背后,是上千个人通过摄像头看美国人买西蓝花?

机器之心报道 机器之心编辑部AI无人商店,背后疑似是1000印度人看摄像头:大厂的「拿货即走」没有走通? 人们常说,有多少智能,就有多少人工。但是,亚马逊...
阅读原文
16667686970126