深度学习各领域数据集有效整理——持续更新
🥇 版权: 本文由【墨理学AI】原创、敬请查阅 🎉 声明: 作为全网 AI 领域 干货最多的博主之一,❤️ 不负光阴不负卿 ❤️
- 声明0:有效整理,是指,相关博文基本都有附官方下载链接
- 声明1:这篇博客是对 墨理学AI数据集整理专栏 当前已经整理的数据集做归纳整理
- 声明2:博客中,任何已经做整理并附分享的CV领域数据集都可以通过添加博主微信 { bravePatch },***
基础数据集网址推荐
首先和大家推荐一下这个 tensorflow 官方的数据整理站点
- https://tensorflow.google.cn/datasets/catalog/coco?hl=zh-cn
- 可以看到类目详细
- 基本每个数据集都会告知我们对应的数据集官方网址
- 看到这里,小伙伴是不是,已经准备好三连了呢
超分重建
风格迁移
图像修复
- 图像修复 mask 下载 | NVIDIA Irregular Mask Dataset | Quick Draw Irregular Mask Dataset | 【❤️有效分享❤️】 |
- 图像修复使用率最高数据集总结 | 2020博文总结
图像去水印
如图所示的一些网图常见水印
OCR 数据集
- A Large Chinese Text Dataset in the Wild | OCR数据集 | 正确下载方式
- SVT | Street View Text Dataset | Chars74K dataset | 带文本的街景 OCR 数据集
人脸识别
- CASIA WebFace—— face recognition data ——人脸识别数据集 —云盘分享
- CelebA-Spoof:具有丰富标注的大规模人脸反欺骗数据集 和 高清人脸数据集 FFHQ
检测-分类
图像语义分割
语音识别
语音识别-声纹识别
硕士期间瞎折腾过一阵子,还是很有感情的,当时也不懂得梳理分析,算是一个深度学习、博文写作的起点吧
- 语音数据集下载地址汇总| 免费的汉语说话人识别语料库 | Common Voice 数据集 | 下载总结
- 中文语音数据 - THCHS-30 : A Free Chinese Speech Corpus 【❤️下载介绍❤️】
- 多领域中文语音识别数据集 WenetSpeech 正式发布——有效下载教程
- 多领域 ASR 英语语料库——GigaSpeech 基本介绍——附有效下载教程
其他
服装类数据集
实用软件工具
常用经典编程软件,如果自行下载困难,可直接添加博主维新,索取
❤️ 未来可期, 欢迎和墨理一起学AI 💜
博主自述
自己有时会有发布数据集或者整理的论文集合去换取积分的操作,当时穷嘛
现在积分富有了,因为充会员了,人世间很多事情并非非黑即白,感谢关注、感谢理解;
声明 :博客中,任何已经做整理并附分享的 CV 领域数据集都可以通过添加博主微信 { bravePatch },***
持续更新
博文所述数据集,大多是在一段时间的学习和工作期间,项目研究确有需求,方去认真挖掘和整理
多有不足之处,各位多多包含
本博文持续更新补充,感谢查阅
🎉 作为全网 AI 领域 干货最多的博主之一,❤️ 不负光阴不负卿 ❤️ ❤️ 码字不易、如果文章对你有帮助、不要忘了、点赞、评论鼓励博主的每一分认真创作