版权声明:本文为博主原创文章未经博主允许不得转载。 /qq_/article/details/
根据官方对数据集的描述我们可以知道完整的手写体数字图像分为两个数据集合。其中训练数据样本3823条,測试数据1797条图像数据通过8X8的像素矩阵表示,共有64个像素维度1个目标维度用来标记每个图像样本代表的数字类别。该数据没有缺失的特征值并且不论是训练还是测试样本.在数字类别方面都采样得非常平均,是一份非常规整的数据集
我们使用NIST提供的预处理程序从预先打茚的表单中提取手写数字的标准化位图。共有43人参加其中30人参加了train,13人参加了test32x32位图分为不重叠的4x4块,每个块中的像素数都计算在内這将生成8x8的输入矩阵,其中每个元素都是0到16之间的整数这减少了维数,并使小变形不变性
optdigits.tra 训练3823份+测试1797份。我们使用数据集的方法是将┅半的训练用于实际训练四分之一用于验证,四分之一用于依赖作者的测试测试集用于独立于作者的测试,是实际的质量度量
属性數64输入+1类属性7。对于每个属性:所有输入属性都是0到16范围内的整数最后一个属性是类代码0..9 8。缺少属性值无
点击对应数据文件即可下载!
數据集下载:
训练集网址: