TensorFlow環境構築(CIFAR-10って何?)

TensorFlow環境構築(CIFAR-10って何?)

はじめに

以前こちらの記事で、TensorFlowを使ったサンプル動作でCIFAR-10を取り上げましたが、これがどのようなものなのかを紹介します。

CIFAR-10とは?

The CIFAR-10 dataset (Canadian Institute For Advanced Research) is a collection of images that are commonly used to train machine learning and computer vision algorithms. It is one of the most widely used datasets for machine learning research.[1][2] The CIFAR-10 dataset contains 60,000 32×32 color images in 10 different classes.[3] The 10 different classes represent airplanes, cars, birds, cats, deer, dogs, frogs, horses, ships, and trucks. There are 6,000 images of each class.[4]

https://en.wikipedia.org/wiki/CIFAR-10

機械学習の学習作業に一般的に用いられる写真の集合体のことで、6万枚の32x32pixelの画像が10種のクラスに分かれているそうです。

クラス一覧:

CIFAR10 dataset

早速公式ページから”CIFAR-10 python version”をダウンロードしてみました。解凍するとこんな感じ。

file content

data_batch_1~5にはそれぞれ1万枚の情報が入っています。(計5万枚
test_batchには1万枚の情報が入っています。
data_batchの1〜5で学習し、それをtest_batchで検証するみたいな流れみたいです。

実際の動作に関してはこちらの記事を参照ください。
今後は各パラメータをいじってみたいと思います。

おすすめ書籍