探索NeurIPS 2024:突破性数据集助力云层去除、化学光谱分析与自动驾驶革新
内含 9 个数据集下载链接
原标题:NeurIPS 2024 数据集汇总|覆盖云层去除/化学光谱/歌声音频/自动驾驶/昆虫标本······
文章来源:HyperAI超神经
内容字数:5113字
NeurIPS 2024 数据集汇总
根据李姝的报道,HyperAI超神经从NeurIPS 2024会议中整理并分享了9个高质量的开源数据集,涵盖云层去除、化学光谱、歌声音频、自动驾驶、昆虫标本等多个领域。这些数据集为研究者提供了丰富的资源,帮助推动相关领域的研究进展。
1. AllClear 公共云层去除数据集
发布机构:康奈尔大学、哥伦比亚大学
预估大小:22.42 GB
下载地址:点击这里
AllClear是目前最大的公共云层去除数据集,包含23,742个全球分布的兴趣区域(ROIs),共计400万张图像,旨在解决云层对下游应用的影响。
2. Muharaf 手写阿拉伯文数据集
发布机构:北卡罗来纳州立大学等
预估大小:9.83 GB
下载地址:点击这里
该数据集专注于手写阿拉伯文识别,包含超过1.6k张历史手写页面图像,促进手写文本识别技术的发展。
3. 化学多模光谱数据集
发布机构:IBM Research等
预估大小:9.7 GB
下载地址:点击这里
该数据集汇集79万种分子的多种光谱数据,旨在通过自动化结构解析简化分子发现流程。
4. GTSinger 歌声音频数据集
发布机构:浙江大学
预估大小:28.94 GB
下载地址:点击这里
包含80.59小时的歌声录音,涵盖多种语言,为音色和风格研究提供了丰富的资源。
5. DrivingDojo 自动驾驶数据集
发布机构:中国科学院等
下载地址:点击这里
该数据集包含约18k个视频片段,旨在提升复杂驾驶环境中的预测和控制能力。
6. 多模态昆虫生物多样性数据集
发布机构:生物多样性基因组学中心等
预估大小:37.71 GB
下载地址:点击这里
包含超过500万昆虫标本的详细信息,旨在监测全球昆虫生物多样性。
7. OpenSatMap 高分辨率卫星数据集
发布机构:中国科学院等
预估大小:57.7 GB
下载地址:点击这里
该数据集专为大规模地图构建而设计,包含3,787张高分辨率卫星图像。
8. 自然物种声音数据集
发布机构:马萨诸塞大学等
预估大小:131.26 GB
下载地址:点击这里
收录230,000个音频文件,涵盖鸟类、哺乳动物等多个物种的声音。
9. MINT-1T 文本图像对多模态数据集
发布机构:华盛顿大学等
下载地址:点击这里
该数据集规模庞大,包含1万亿个文本标记和34亿张图像,为科学文档研究提供了丰富的数据资源。
以上是HyperAI超神经为大家汇总的NeurIPS 2024数据集,若有意向收录其他资源,欢迎留言或投稿。欲了解更多信息,请访问HyperAI超神经官网。
联系作者
文章来源:HyperAI超神经
作者微信:
作者简介:解构技术先进性与普适性,报道更前沿的 AIforScience 案例