标签：数据

Karpathy点赞，这份报告教你如何用 LLaMa 3创建高质量网络数据集

机器之心报道作者：蛋酱、小舟众所周知，对于 Llama3、GPT-4 或 Mixtral 等高性能大语言模型来说，构建高质量的网络规模数据集是非常重要的。然而，即使是最...

阅读原文

AIGC动态

2年前 (2024)

AI训练数据的版权保护:公地的悲剧还是合作的繁荣?

机器之心报道机器之心编辑部就算是 OpenAI 在舆论场也无法逃过版权保护的呼声。GPT-4o内置声音模仿「寡姐」一案闹的沸沸扬扬，虽然以OpenAI发布声明暂停使用...

阅读原文

AIGC动态

2年前 (2024)

AI预测极端天气提速5000倍！微软发布Aurora，借AI之眼预测全球风暴

新智元报道编辑：庸庸好困【新智元导读】微软发布首个大规模大气基础模型Aurora，可被用于预测和减轻极端天气影响，模型拥有超高的准确率和效率，与如今数...

阅读原文

AIGC动态

2年前 (2024)

即插即用，快速适配！港大FlashST：简单通用的智慧交通时空预测模型 | ICML 2024

新智元报道编辑：LRT 【新智元导读】华南理工大学和香港大学的研究人员在ICML 2024上提出了一个简单而通用的时空提示调整框架FlashST，通过轻量级的时空提示...

阅读原文

AIGC动态

2年前 (2024)

浅谈大模型 SFT 的实践落地：10 问 10 答

来源｜知乎—周星星地址｜https://zhuanlan.zhihu.com/p/685582706 前言SFT 是“低端”的工作，但它与业务紧密相连。相较于难以实施且多数公司没资源训练的预训...

阅读原文

AIGC动态

2年前 (2024)

不同数据集有不同的Scaling law？而你可用一个压缩算法来预测它

机器之心报道机器之心编辑部一般而言，训练神经网络耗费的计算量越大，其性能就越好。在扩大计算规模时，必须要做个决定：是增多模型参数量还是提升数据集大...

阅读原文

AIGC动态

2年前 (2024)

一键部署LLaMA 3 Chinese Chat，含中文训练数据集；Food2K数据集下载，含2千类别，100万张图片

前段时间 Llama 3 的重磅开源让 AI 圈的众人都兴奋了一把，但它对纯中文的支持不是很好，不能灵活地根据中文提问切换至相应语言进行回答。 hyper.ai 本周上线...

阅读原文

AIGC动态

2年前 (2024)

搞定视频任务泛化，VLM 还有机会吗？

机器之心PRO · 会员通讯 Week 22---- 本周为您解读 ③个值得细品的AI & Robotics业内要事 ---- 1. 搞定视频任务泛化，VLM 还有机会吗？搞定视频任务泛化为...

阅读原文

AIGC动态

2年前 (2024)

开源模型进展盘点：最新Mixtral、Llama 3、Phi-3、OpenELM到底有多好？

机器之心报道编辑：Panda深度学习领域知名研究者、Lightning AI 的首席人工智能教育者 Sebastian Raschka 对 AI 大模型有着深刻的洞察，也会经常把一些观察...

阅读原文

AIGC动态

2年前 (2024)

AI训练数据成本高昂，仅剩巨头玩得起！

点击上方蓝字关注我们“随着AI训练数据成本的不断攀升，仅有资金雄厚的科技巨头如谷歌和Meta能够承担。这导致AI发展日益集中化，小型企业和学术机构难以参与竞...

阅读原文

AIGC动态

2年前 (2024)

AI大模型工业应用模式及其实现

来源：先进制造业作者：中国工业互联网研究院通用人工智能与工业融合创新中心先进制造业·导读人工智能是引领这一轮科技革命和产业变革的战略性技术，具有“...

阅读原文

AIGC动态

2年前 (2024)

ChatGPT真能记住你的话吗？DeepMind与开源大佬揭示LLM记忆之谜

新智元报道编辑：乔杨【新智元导读】LLM有记忆能力吗？有，也没有。虽然ChatGPT聊天时好像可以记住你之前说的话，但实际上，模型在推理时记不住任何内容，而...

阅读原文

AIGC动态

2年前 (2024)

六位一线AI工程师总结爆火！大模型应用摸爬滚打一年心得公开，网友：全程高能

梦晨西风发自凹非寺量子位 | 公众号 QbitAI六位一线AI工程师和创业者，把在大模型应用开发上摸爬滚打一整年的心得，全！分！享！了！（奇怪的六一儿童节...

阅读原文

AIGC动态

2年前 (2024)

首个智慧城市大模型UrbanGPT，全面开源开放｜港大&百度

UrbanGPT团队投稿量子位 | 公众号 QbitAI时空预测技术，迎来ChatGPT时刻。时空预测致力于捕捉城市生活的动态变化，并预测其未来走向，它不仅关注交通和人流...

阅读原文

AIGC动态

2年前 (2024)

CVPR 2024 | 合成视频数据集里只有单人数据？M3Act人群行为标注难题

AIxiv专栏是机器之心发布学术、技术内容的栏目。过去数年，机器之心AIxiv专栏接收报道了2000多篇内容，覆盖全球各大高校与企业的顶级实验室，有效促进了学术...

阅读原文

AIGC动态

2年前 (2024)

1…48 495051 52…126