n4okins / 主要データセットのリンク集

Created Mon, 08 Jul 2024 14:55:30 +0900 Modified Mon, 08 Jul 2024 14:55:30 +0900
236 Words

カッコ内は大まかな容量

ImageNet-1K (165GB)

Kaggle版

Tiny-ImageNet (240MB) :

Open Images Dataset V7 (560GB)

COCO - MSCOCO 2014, 2017 (25GB)

Tiny-Stories (2GB)

IWSLT 2014 (20MB, 直リンク)

Wikipedia - Image/Caption Matching (75GB + 275GB)

Edinburgh NLP

CMU Question-Answering Dataset