我刚刚在python3.6上安装了autokeras。经过一些错误修复后,它运行良好,我可以使用我的数据集训练模型。
训练后我得到的模型精度为 0.991,损失为 0.06。通过预测函数,它对我的测试数据集进行分类几乎没有任何错误。
但是当我将其导出并保存为 keras 模型时,该模型的表现非常糟糕。它对所有内容进行了错误的分类,并且预测函数仅返回随机小数,而不是预期类别的数量。
我想我只是缺少一些命令,因为图像分类器运行良好。
任何帮助或提示都会非常好。
编辑:
我基本上按照上面的例子https://autokeras.com/start/。我将数据预处理为形状 (n, 150, 150, 3) 且范围在 0 到 1 之间。每个图像的代码如下:
img='/home/example_image.png'
x=image.img_to_array(image.load_img(img, target_size=(150, 150)))
x=x.reshape(1, 150, 150, 3)
x = x.astype('float32') / 255
我还尝试使用 50x50 形状的图像,因为 autokeras 似乎更适合较小的形状。我的标签是长度为 n 的列表。然后我使用网站上的代码:
clf = ImageClassifier(verbose=True)
clf.fit(x_train, y_train, time_limit=12 * 60 * 60)
clf.final_fit(x_train, y_train, x_test, y_test, retrain=True)
y = clf.evaluate(x_test, y_test)
print(y)
它返回了一个非常好的模型,精度高,损失小。我无法向您展示输出的屏幕截图,因为我目前在家,而我的笔记本电脑性能太弱,无法重现此问题。当我使用以下命令时:
clf.predict(example_img)
我还得到了图像中物体数量的正确结果。
当我尝试使用其网站上给出的命令导出模型时,我的问题开始了:
from autokeras import ImageClassifier
clf = ImageClassifier(verbose=True, augment=False)
clf.load_searcher().load_best_model().produce_keras_model().save('my_model.h5')
之后我加载我的模型。
import keras
from keras.models import load_model
model = load_model('my_model.h5')
它给了我一些错误:
“用户警告:在保存文件中找不到训练配置:模型未编译。手动编译。
warnings.warn('在保存文件中找不到训练配置:'"
我搜索过它,但人们说忽略它。
但是,当我尝试对这个加载的模型使用预测时,我总是得到一些随机十进制值的数组,这些值通常为负数。分类总是错误的,因为该数组中的最高值属于错误的类别。
当我再次使用机器学习计算机回到办公室时,我将使用更多屏幕截图和详细信息编辑此文本。
编辑2:
当我训练模型时,这是最好的模型:
+--------------------------------------------------------------------------+
| Father Model ID | Added Operation |
+--------------------------------------------------------------------------+
| | ('to_add_skip_model', 1, 5) |
| | ('to_wider_model', 1, 64) |
| | ('to_wider_model', 5, 64) |
| 5 | ('to_conv_deeper_model', 9, 3) |
| | ('to_conv_deeper_model', 23, 3) |
| | ('to_concat_skip_model', 5, 9) |
+--------------------------------------------------------------------------+
Saving model.
+--------------------------------------------------------------------------+
| Model ID | Loss | Metric Value |
+--------------------------------------------------------------------------+
| 6 | 0.014135746611282229 | 1.0 |
+--------------------------------------------------------------------------+
之后我使用了final_fit并尝试了predict_function:
>>> clf.predict(test_images)
array([ 0., 0., 0., ..., 12., 12., 12.])
这是预期的输出。评估也给出了很好的结果:
>>> y = clf.evaluate(test_images, test_labels)
>>> print(y)
0.9969230769230769
然后我将模型导出为 keras 模型并再次加载:
>>> from keras import models
>>> clf.load_searcher().load_best_model().produce_keras_model().save('keras_best_model.h5')
>>> model = models.load_model('keras_best_model.h5')
一切都很好,我没有收到任何错误。但是当我现在使用 Predict_function 时它会返回错误的结果:
>>> model.predict(test_images[0].reshape(1, 50, 50, 3))
array([[ 2.5287893, -2.2281592, -2.8172228, 1.1171696, -5.8477755,
-3.1250796, 1.4904132, 1.1068834, -4.982565 , -1.6350467,
-4.3806715, -2.7464929, -6.1051216]], dtype=float32)
所以 clf.predict 给我一个数字,而 model.predict 给我一个数组。不应该是一样的吗?几乎所有的预测都是错误的。当我评估模型时,这是输出:
>>> model.evaluate(test_images, test_labels1)
2600/2600 [==============================] - 1s 569us/step
[5.251570468682509, 0.10115384615384615]
与 clf 评估相比,它完全不好,我不知道为什么。