标签:数据
Karpathy点赞,这份报告教你如何用 LLaMa 3创建高质量网络数据集
机器之心报道 作者:蛋酱、小舟众所周知,对于 Llama3、GPT-4 或 Mixtral 等高性能大语言模型来说,构建高质量的网络规模数据集是非常重要的。然而,即使是最...
AI训练数据的版权保护:公地的悲剧还是合作的繁荣?
机器之心报道 机器之心编辑部就算是 OpenAI 在舆论场也无法逃过版权保护的呼声。GPT-4o内置声音模仿「寡姐」一案闹的沸沸扬扬,虽然以OpenAI发布声明暂停使用...
AI预测极端天气提速5000倍!微软发布Aurora,借AI之眼预测全球风暴
新智元报道编辑:庸庸 好困 【新智元导读】微软发布首个大规模大气基础模型Aurora,可被用于预测和减轻极端天气影响,模型拥有超高的准确率和效率,与如今数...
即插即用,快速适配!港大FlashST:简单通用的智慧交通时空预测模型 | ICML 2024
新智元报道编辑:LRT 【新智元导读】华南理工大学和香港大学的研究人员在ICML 2024上提出了一个简单而通用的时空提示调整框架FlashST,通过轻量级的时空提示...
浅谈大模型 SFT 的实践落地:10 问 10 答
来源|知乎—周星星 地址|https://zhuanlan.zhihu.com/p/685582706 前言SFT 是“低端”的工作,但它与业务紧密相连。相较于难以实施且多数公司没资源训练的预训...
不同数据集有不同的Scaling law?而你可用一个压缩算法来预测它
机器之心报道 机器之心编辑部一般而言,训练神经网络耗费的计算量越大,其性能就越好。在扩大计算规模时,必须要做个决定:是增多模型参数量还是提升数据集大...
一键部署LLaMA 3 Chinese Chat,含中文训练数据集;Food2K数据集下载,含2千类别,100万张图片
前段时间 Llama 3 的重磅开源让 AI 圈的众人都兴奋了一把,但它对纯中文的支持不是很好,不能灵活地根据中文提问切换至相应语言进行回答。 hyper.ai 本周上线...
搞定视频任务泛化,VLM 还有机会吗?
机器之心PRO · 会员通讯 Week 22---- 本周为您解读 ③个值得细品的AI & Robotics业内要事 ---- 1. 搞定视频任务泛化,VLM 还有机会吗?搞定视频任务泛化为...
开源模型进展盘点:最新Mixtral、Llama 3、Phi-3、OpenELM到底有多好?
机器之心报道 编辑:Panda深度学习领域知名研究者、Lightning AI 的首席人工智能教育者 Sebastian Raschka 对 AI 大模型有着深刻的洞察,也会经常把一些观察...
AI训练数据成本高昂,仅剩巨头玩得起!
点击上方蓝字关注我们“随着AI训练数据成本的不断攀升,仅有资金雄厚的科技巨头如谷歌和Meta能够承担。这导致AI发展日益集中化,小型企业和学术机构难以参与竞...
ChatGPT真能记住你的话吗?DeepMind与开源大佬揭示LLM记忆之谜
新智元报道编辑:乔杨 【新智元导读】LLM有记忆能力吗?有,也没有。虽然ChatGPT聊天时好像可以记住你之前说的话,但实际上,模型在推理时记不住任何内容,而...
六位一线AI工程师总结爆火!大模型应用摸爬滚打一年心得公开,网友:全程高能
梦晨 西风 发自 凹非寺量子位 | 公众号 QbitAI六位一线AI工程师和创业者,把在大模型应用开发上摸爬滚打一整年的心得,全!分!享!了! (奇怪的六一儿童节...
首个智慧城市大模型UrbanGPT,全面开源开放|港大&百度
UrbanGPT团队 投稿量子位 | 公众号 QbitAI时空预测技术,迎来ChatGPT时刻。 时空预测致力于捕捉城市生活的动态变化,并预测其未来走向,它不仅关注交通和人流...
CVPR 2024 | 合成视频数据集里只有单人数据?M3Act人群行为标注难题
AIxiv专栏是机器之心发布学术、技术内容的栏目。过去数年,机器之心AIxiv专栏接收报道了2000多篇内容,覆盖全球各大高校与企业的顶级实验室,有效促进了学术...