lw3 added

2 месяцев назад · e726898cb1
--- a/dE.docx
+++ b/dE.docx
--- a/is/pics/i1.png
+++ b/is/pics/i1.png
--- a/is/pics/i2.png
+++ b/is/pics/i2.png
--- a/is/pics/i3.png
+++ b/is/pics/i3.png
--- a/is/pics/i4.png
+++ b/is/pics/i4.png
--- a/is/pics/i5.png
+++ b/is/pics/i5.png
--- a/is/pics/i6.png
+++ b/is/pics/i6.png
--- a/is/report.md
+++ b/is/report.md
@ -0,0 +1,529 @@
+## Лабораторная работа №3 ИС. Распознавание изображений
+
+#### Выполнили: Ишутина Е. И., Голубев Т. Л.
+
+В работе проводится исследование моделей глубокого обучения при классификации изображений. Рассматривались два набора данных: MNIST с черно-белыми изображениями цифр, и CIFAR-10 с цветными изображениями десяти классов (cat, deer, truck и т.д.) размерности 32×32 пикселя. Для обоих наборов была выполнена нормализация и приведение меток классов к формату one-hot.
+
+One-hot - кодирование данных в виде вектора, содержащего столько элементов, сколько существует классов. Все элементы равны нулю (или близки) кроме значения на позиции, соответствующей истинному классу (там значение ближе к единице). Такой формат нужен в нейронных сетях, где выходной слой формирует распределение вероятностей по классам.
+
+Для набора MNIST обучена сверточная нейронная сеть, а затем произведено её сравнение с лучшей полносвязной моделью из ЛР1. Для набора CIFAR-10 была реализована модель сверточной нейронной сети и оценена результативность ее работы.
+
+## Задание 1
+#### *1. В среде Google Colab создать новый блокнот (notebook). Импортировать необходимые для работы библиотеки и модули*
+
+Подключены библиотеки. Создана рабочая директория на Google Диске и зафиксированы генераторы случайных чисел для обеспечения воспроизводимости результатов.
+
+```python
+from google.colab import drive
+drive.mount('/content/drive')
+
+import os
+os.chdir('/content/drive/MyDrive/Colab Notebooks/is_lab3')
+
+import numpy as np
+import matplotlib.pyplot as plt
+
+from tensorflow import keras
+from tensorflow.keras import layers
+from tensorflow.keras.models import Sequential
+
+from sklearn.metrics import classification_report, confusion_matrix, ConfusionMatrixDisplay
+from sklearn.model_selection import train_test_split
+
+import tensorflow as tf
+tf.random.set_seed(123)
+np.random.seed(123)
+```
+```python
+Mounted at /content/drive
+```
+#### *2. Загрузить набор данных MNIST, содержащий размеченные изображения рукописных цифр.*
+
+Загружен набор данных MNIST, включающий 70 000 размеченных изображений рукописных цифр размерностью 28×28 пикселей. Набор состоял из 60 000 изображений обучающей выборки и 10 000 изображений тестовой выборки, при этом каждой матрице пикселей соответствовала метка класса от 0 до 9. После загрузки обе части набора были объединены в единые массивы данных, чтобы потом выполнить разбиение согласно варианту задания.
+
+```python
+from keras.datasets import mnist
+
+(X_train_full, y_train_full), (X_test_full, y_test_full) = mnist.load_data()
+
+X = np.concatenate((X_train_full, X_test_full), axis=0)
+y = np.concatenate((y_train_full, y_test_full), axis=0)
+```
+```python
+Downloading data from https://storage.googleapis.com/tensorflow/tf-keras-datasets/mnist.npz
+11490434/11490434 ━━━━━━━━━━━━━━━━━━━━ 0s 0us/step
+```
+
+#### *3. Разбить набор данных на обучающие и тестовые данные в соотношении 60000:10000 элементов. При разбиении параметр random_state выбрать равным (4k–1), где k – номер бригады. Вывести размерности полученных обучающих и тестовых массивов данных.*
+
+```python
+k = 5
+random_state = 4 * k - 1
+
+X_train, X_test, y_train, y_test = train_test_split(
+    X, y, train_size=60000, test_size=10000, random_state=random_state, shuffle=True
+)
+
+print('Shape of X_train:', X_train.shape)
+print('Shape of y_train:', y_train.shape)
+print('Shape of X_test:', X_test.shape)
+print('Shape of y_test:', y_test.shape)
+```
+Выведенные размерности подтвердили корректность проведённого разбиения и соответствие полученных массивов заданным параметрам.
+```python
+Shape of X_train: (60000, 28, 28)
+Shape of y_train: (60000,)
+Shape of X_test: (10000, 28, 28)
+Shape of y_test: (10000,)
+```
+
+
+#### *4. Провести предобработку данных: привести обучающие и тестовые данные к  формату,  пригодному  для  обучения сверточной нейронной  сети. Входные данные  должны  принимать  значения  от  0  до  1, метки  цифр должны  быть  закодированы  по  принципу  «one-hot encoding». Вывести размерности предобработанных обучающих и тестовых массивов данных.*
+
+Значения пикселей приведены к диапазону [0, 1], метки классов были преобразованы в формат one-hot, где каждый класс представлен вектором длины десять.
+
+```python
+num_classes = 10
+input_shape = (28, 28, 1)
+
+# приведение значений к диапазону [0,1]
+X_train = X_train.astype('float32') / 255.0
+X_test  = X_test.astype('float32') / 255.0
+
+# добавление размерности каналов
+X_train = np.expand_dims(X_train, -1)
+X_test  = np.expand_dims(X_test, -1)
+
+# one-hot кодирование меток
+y_train_cat = keras.utils.to_categorical(y_train, num_classes)
+y_test_cat  = keras.utils.to_categorical(y_test, num_classes)
+
+print('Shape of transformed X_train:', X_train.shape)
+print('Shape of transformed y_train:', y_train_cat.shape)
+print('Shape of transformed X_test:', X_test.shape)
+print('Shape of transformed y_test:', y_test_cat.shape)
+```
+Выведенные размерности подтвердили корректное преобразование изображений в тензоры формы 28×28×1 и меток в матрицы 60000×10 и 10000×10 для обучающей и тестовой выборок соответственно.
+
+```python
+Shape of transformed X_train: (60000, 28, 28, 1)
+Shape of transformed y_train: (60000, 10)
+Shape of transformed X_test: (10000, 28, 28, 1)
+Shape of transformed y_test: (10000, 10)
+```
+
+#### *5. Реализовать  модель  сверточной  нейронной  сети  и  обучить  ее  на обучающих данных с выделением части обучающих данных в качестве валидационных. Вывести информацию об архитектуре нейронной сети.*
+Пояснения по коду:
+* batch_size – размер батча (количество изображений, обрабатываемых одновременно за один шаг градиентного спуска). Используется Sequential API, где слои добавляются один за другим. Это удобно для простых последовательных моделей CNN.
+
+* Conv2D(32, (3,3)): 32 фильтра размером 3×3, которые будут сканировать изображение.
+
+* input_shape=input_shape: форма входных данных (например, (28,28,1) для серых изображений MNIST).
+
+* MaxPooling2D(2,2) уменьшает размерность признаков в 2 раза, выбирая максимум в каждом окне 2×2.
+
+* Dropout(0.5) случайным образом отключает 50% нейронов во время обучения, чтобы уменьшить переобучение.
+
+```python
+batch_size = 512
+epochs = 15
+
+model = Sequential()
+model.add(layers.Conv2D(32, kernel_size=(3,3), activation='relu', input_shape=input_shape))
+model.add(layers.MaxPooling2D(pool_size=(2,2)))
+model.add(layers.Conv2D(64, kernel_size=(3,3), activation='relu'))
+model.add(layers.MaxPooling2D(pool_size=(2,2)))
+model.add(layers.Dropout(0.5))
+model.add(layers.Flatten())
+model.add(layers.Dense(num_classes, activation='softmax'))
+
+model.compile(loss='categorical_crossentropy', optimizer='adam', metrics=['accuracy'])
+model.summary()
+
+history = model.fit(X_train, y_train_cat, batch_size=batch_size, epochs=epochs, validation_split=0.1)
+```
+
+```python
+/usr/local/lib/python3.12/dist-packages/keras/src/layers/convolutional/base_conv.py:113: UserWarning: Do not pass an `input_shape`/`input_dim` argument to a layer. When using Sequential models, prefer using an `Input(shape)` object as the first layer in the model instead.
+  super().__init__(activity_regularizer=activity_regularizer, **kwargs)
+
+Model: "sequential"
+| Layer (type)               | Output shape        | Param # |
+|----------------------------|----------------------|---------|
+| conv2d (Conv2D)            | (None, 26, 26, 32)   | 320     |
+| max_pooling2d (MaxPooling) | (None, 13, 13, 32)   | 0       |
+| conv2d_1 (Conv2D)          | (None, 11, 11, 64)   | 18,496  |
+| max_pooling2d_1 (MaxPooling) | (None, 5, 5, 64)   | 0       |
+| dropout (Dropout)          | (None, 5, 5, 64)     | 0       |
+| flatten (Flatten)          | (None, 1600)         | 0       |
+| dense (Dense)              | (None, 10)           | 16,010  |
+
+ Total params: 34,826 (136.04 KB)
+ Trainable params: 34,826 (136.04 KB)
+ Non-trainable params: 0 (0.00 B)
+```
+
+#### *6. Оценить  качество  обучения  на  тестовых  данных. Вывести  значение функции ошибки и значение метрики качества классификациина тестовых данных.*
+
+```python
+scores = model.evaluate(X_test, y_test_cat, verbose=2)
+print('Loss on test data:', scores[0])
+print('Accuracy on test data:', scores[1])
+```
+```python
+313/313 - 3s - 8ms/step - accuracy: 0.9879 - loss: 0.0402
+Loss on test data: 0.04024936258792877
+Accuracy on test data: 0.9879000186920166
+```
+Vодель обучена хорошо и показывает высокое качество на тестовой выборке.
+
+#### *7. Подать на вход обученной модели два тестовых изображения. Вывести изображения, истинные метки и результаты распознавания.*
+Пояснения по коду:
+* Берём два изображения из тестового набора (с индексами 0 и 1).
+* X_test[n:n+1] — формируем батч из одного изображения. 
+* model.predict() возвращает вектор вероятностей для каждого класса (10 элементов для цифр 0–9).
+* NN output vector показывает вероятности для всех 10 классов.
+
+```python
+indices = [0, 1]
+for n in indices:
+    result = model.predict(X_test[n:n+1])
+    plt.figure()
+    plt.imshow(X_test[n].reshape(28,28), cmap='gray')
+    plt.title(f"Real: {y_test[n]}  Pred: {np.argmax(result)}")
+    plt.axis('off')
+    plt.show()
+    print('NN output vector:', result)
+    print('Real mark:', y_test[n])
+    print('NN answer:', np.argmax(result))
+```
+
+![image](pics/i1.png)
+```python
+NN output vector: [[3.5711860e-08 3.5435047e-11 6.5117740e-07 7.4699518e-09 5.9110135e-08
+  1.4115658e-03 9.9851364e-01 2.6488631e-12 7.4022493e-05 2.6488609e-10]]
+Real mark: 6
+NN answer: 6
+```
+![image](pics/i2.png)
+```python
+NN output vector: [[9.2878885e-08 3.3229617e-06 4.1963812e-04 3.1485452e-04 1.7722991e-09
+  2.6501787e-09 5.7302459e-13 9.9888808e-01 1.0063148e-05 3.6401587e-04]]
+Real mark: 7
+NN answer: 7
+```
+Как видно, модель верно распознала случайно выбранные две цифры. В выходном векторе у всех значений, кроме позиции верного класса, были значения порядка 10^-4 - 10^-13. Значение для верного класса близко к единице.
+
+#### *8. Вывести отчет о качестве классификации тестовой выборки и матрицу ошибок для тестовой выборки.*
+
+* Precision = 0.99 для класса 0 означает, что почти все объекты, которые сеть предсказала как «0», действительно 0. Recall 1.00 для класса 0 означает, что сеть нашла все объекты «0» в тестовой выборке.
+Accuracy (общая точность) = 0.99 дает понять, что модель правильно классифицирует 99% изображений.
+
+
+* В матрице ошибок основная часть значений находится на диагонали, а значит, большинство предсказаний верные. С помощью небольших ошибок вне диагоналей можно понять, какие числа нейросеть «путает». Например, сеть может перепутать «4» и «9», или «3» и «5», если они визуально похожи.
+
+```python
+true_labels = y_test
+predicted_labels = np.argmax(model.predict(X_test), axis=1)
+
+print(classification_report(true_labels, predicted_labels))
+conf_matrix = confusion_matrix(true_labels, predicted_labels)
+display = ConfusionMatrixDisplay(confusion_matrix=conf_matrix)
+display.plot()
+plt.show()
+```
+```python
+precision    recall  f1-score   support
+
+           0       0.99      1.00      0.99       969
+           1       0.99      0.99      0.99      1155
+           2       0.99      0.98      0.98       969
+           3       0.99      0.99      0.99      1032
+           4       1.00      0.98      0.99      1016
+           5       0.98      0.99      0.98       898
+           6       0.99      0.99      0.99       990
+           7       0.98      0.99      0.99      1038
+           8       0.99      0.98      0.99       913
+           9       0.99      0.98      0.98      1020
+
+    accuracy                           0.99     10000
+   macro avg       0.99      0.99      0.99     10000
+weighted avg       0.99      0.99      0.99     10000
+```
+![image](pics/i3.png)
+
+#### *9. Загрузить, предобработать и подать на вход обученной нейронной сети собственное  изображение,  созданное  при  выполнении  лабораторной работы №1. Вывести изображение и результат распознавания.*
+
+```python
+from PIL import Image
+
+img_path = '../5.png'
+
+file_data = Image.open(img_path)
+file_data = file_data.convert('L')  # перевод в градации серого
+test_img = np.array(file_data)
+
+plt.imshow(test_img, cmap='gray')
+plt.axis('off')
+plt.show()
+
+# нормализация и изменение формы
+test_proc = test_img.astype('float32') / 255.0
+test_proc = np.reshape(test_proc, (1, 28, 28, 1))
+
+result = model.predict(test_proc)
+print("NN output vector:", result)
+print("I think it's", np.argmax(result))
+```
+
+![image](pics/i4.png)
+
+```python
+NN output vector: [[1.5756325e-12 5.2755486e-15 1.4891595e-10 7.3797599e-07 1.8559115e-12
+  9.9998915e-01 3.5407410e-08 5.2025315e-12 1.5018414e-06 8.6681475e-06]]
+I think it's 5
+```
+
+### 10. Загрузить с диска модель, сохраненную при выполнении лабораторной работы №1. Вывести информацию об архитектуре модели.Повторить для этой модели п.6.
+
+При работе с моделью из ЛР1 необходимо взять данные в исходном формате, иначе получится двойная нормализация. В CNN данные нормализовались на этапе подготовки к сети (X/255.0 и reshape к (28,28,1)), но модель из ЛР1 ожидала плоский вектор 784 элементов на изображение.
+
+```python
+# возьмём оригинальные X, y — до всех преобразований для CNN
+(X_train_full, y_train_full), (X_test_full, y_test_full) = mnist.load_data()
+
+# объединим, чтобы сделать то же разбиение, что и в ЛР1
+X_all = np.concatenate((X_train_full, X_test_full), axis=0)
+y_all = np.concatenate((y_train_full, y_test_full), axis=0)
+
+from sklearn.model_selection import train_test_split
+X_train_l1, X_test_l1, y_train_l1, y_test_l1 = train_test_split(
+    X_all, y_all, train_size=60000, test_size=10000, random_state=19
+)
+
+# теперь — подготовка данных ЛР1
+X_test_lr1 = X_test_l1.reshape((X_test_l1.shape[0], 28*28)).astype('float32') / 255.0
+y_test_lr1 = keras.utils.to_categorical(y_test_l1, 10)
+
+# оценка модели
+scores_lr1 = model_lr1.evaluate(X_test_lr1, y_test_lr1, verbose=2)
+print(scores_lr1)
+```
+Точность уменьшилась, так как в ЛР1 использовалась полносвязная сеть, а не сверточная. Сверточные сети лучше извлекают признаки у изображений, а потому дают большую точность.
+```python
+313/313 - 2s - 6ms/step - accuracy: 0.9445 - loss: 0.1969
+[0.1968761384487152, 0.9445000290870667]
+```
+
+### 11. Сравнить  обученную  модель  сверточной  сети  и  наилучшую  модель полносвязной  сети  из  лабораторной  работы  №1  по  следующим показателям: количество настраиваемых параметров в сети, количество эпох обучения, качество классификации тестовой выборки. Сделать выводы по результатам применения сверточной нейронной сети для распознавания изображений. 
+
+```python
+# загрузка сохранённой модели ЛР1
+model_lr1_path = '../best_model_2x100.h5'
+model_lr1 = load_model(model_lr1_path)
+model_lr1.summary()
+
+# подготовка тестового набора для модели ЛР1
+X_test_l1 = X_test_l1.reshape((X_test_l1.shape[0], 28 * 28)).astype('float32') / 255.0
+y_test_l1_cat = keras.utils.to_categorical(y_test_l1, 10)
+
+# оценка модели ЛР1
+scores_lr1 = model_lr1.evaluate(X_test_l1, y_test_l1_cat, verbose=2)
+print('LR1 model - Loss:', scores_lr1[0])
+print('LR1 model - Accuracy:', scores_lr1[1])
+
+# оценка сверточной модели ЛР3
+scores_conv = model.evaluate(X_test, y_test_cat, verbose=2)
+print('Conv model - Loss:', scores_conv[0])
+print('Conv model - Accuracy:', scores_conv[1])
+
+# вывод числа параметров обеих моделей
+print('LR1 model parameters:', model_lr1.count_params())
+print('Conv model parameters:', model.count_params())
+```
+В MLP (ЛР1)	количество параметров = 89610, а в CNN (ЛР3) оно равно 34826. CNN имеет значительно меньше параметров, примерно в 2,5 раза меньше, чем MLP. Это произошло потому, что в сверточных слоях параметры делятся по ядрам свертки и применяются к локальным областям изображения, что снижает избыточность. MLP полностью соединяет все нейроны между слоями, а значит, имеет больше весов. Меньшее число параметров влечет к меньшей вероятности переобучения и более экономное использование памяти.
+
+Значение функции потерь у CNN почти в 5 раз меньше, что указывает на лучшее соответствие предсказаний истинным меткам.
+
+```python
+WARNING:absl:Compiled the loaded model, but the compiled metrics have yet to be built. `model.compile_metrics` will be empty until you train or evaluate the model.
+Model: "sequential_9"
+
+| Layer (type) | Output shape | Param # |
+|--------------|--------------|---------|
+| dense_18     | (None, 100)  | 78,500  |
+| dense_19     | (None, 100)  | 10,100  |
+| dense_20     | (None, 10)   | 1,010   |
+
+Total params: 89,612 (350.05 KB)
+Trainable params: 89,610 (350.04 KB)
+Non-trainable params: 0 (0.00 B)
+Optimizer params: 2 (12.00 B)
+313/313 - 3s - 9ms/step - accuracy: 0.9445 - loss: 0.1969
+LR1 model - Loss: 0.1968761384487152
+LR1 model - Accuracy: 0.9445000290870667
+313/313 - 6s - 20ms/step - accuracy: 0.9879 - loss: 0.0402
+Conv model - Loss: 0.04024936258792877
+Conv model - Accuracy: 0.9879000186920166
+LR1 model parameters: 89610
+Conv model parameters: 34826
+```
+
+## Задание 2.
+#### *1–3. Загрузка CIFAR-10 и разбиение 50 000 : 10 000, вывод 25 изображений*
+
+CIFAR-10 — это стандартный набор цветных изображений маленького размера (32×32 пикселя) с 10 классами объектов, включая транспорт, животных и птиц, предназначенный для задач классификации изображений.
+
+Аналогично заданию №1, данные нормализуются и преобразовываются в формат one-hot.
+```python
+from keras.datasets import cifar10
+
+(X_train_c, y_train_c), (X_test_c, y_test_c) = cifar10.load_data()
+
+print('Shapes (original):', X_train_c.shape, y_train_c.shape, X_test_c.shape, y_test_c.shape)
+
+class_names = ['airplane', 'automobile', 'bird', 'cat', 'deer',
+               'dog', 'frog', 'horse', 'ship', 'truck']
+
+# вывод 25 изображений
+plt.figure(figsize=(10,10))
+for i in range(25):
+    plt.subplot(5,5,i+1)
+    plt.xticks([])
+    plt.yticks([])
+    plt.grid(False)
+    plt.imshow(X_train_c[i])
+    plt.xlabel(class_names[y_train_c[i][0]])
+plt.show()
+```
+```python
+Downloading data from https://www.cs.toronto.edu/~kriz/cifar-10-python.tar.gz
+170498071/170498071 ━━━━━━━━━━━━━━━━━━━━ 4s 0us/step
+Shapes (original): (50000, 32, 32, 3) (50000, 1) (10000, 32, 32, 3) (10000, 1)
+```
+![image](pics/i5.png)
+
+#### *4. Предобработка CIFAR-10 (нормализация и one-hot)*
+
+```python
+num_classes = 10
+input_shape_cifar = (32, 32, 3)
+
+X_train_c = X_train_c.astype('float32') / 255.0
+X_test_c  = X_test_c.astype('float32') / 255.0
+
+y_train_c_cat = keras.utils.to_categorical(y_train_c, num_classes)
+y_test_c_cat  = keras.utils.to_categorical(y_test_c, num_classes)
+
+print('Transformed shapes:', X_train_c.shape, y_train_c_cat.shape, X_test_c.shape, y_test_c_cat.shape)
+```
+```python
+Transformed shapes: (50000, 32, 32, 3) (50000, 10) (10000, 32, 32, 3) (10000, 10)
+```
+
+#### *5. Реализация и обучение сверточной сети для CIFAR-10*
+
+Используются три слоя Conv2D с увеличивающимся числом фильтров (32 → 64 → 128) для извлечения признаков с изображений CIFAR-10. Между сверточными слоями используются MaxPooling2D для уменьшения размерности и концентрации на важных признаках.
+
+```python
+model_cifar = Sequential()
+model_cifar.add(layers.Conv2D(32, (3,3), activation='relu', input_shape=input_shape_cifar))
+model_cifar.add(layers.MaxPooling2D((2,2)))
+model_cifar.add(layers.Conv2D(64, (3,3), activation='relu'))
+model_cifar.add(layers.MaxPooling2D((2,2)))
+model_cifar.add(layers.Conv2D(128, (3,3), activation='relu'))
+model_cifar.add(layers.MaxPooling2D((2,2)))
+model_cifar.add(layers.Flatten())
+model_cifar.add(layers.Dense(128, activation='relu'))
+model_cifar.add(layers.Dropout(0.5))
+model_cifar.add(layers.Dense(num_classes, activation='softmax'))
+
+model_cifar.compile(loss='categorical_crossentropy', optimizer='adam', metrics=['accuracy'])
+model_cifar.summary()
+
+batch_size = 512
+epochs = 20
+history_cifar = model_cifar.fit(X_train_c, y_train_c_cat, batch_size=batch_size, epochs=epochs, validation_split=0.1)
+```
+
+
+```python
+/usr/local/lib/python3.12/dist-packages/keras/src/layers/convolutional/base_conv.py:113: UserWarning: Do not pass an `input_shape`/`input_dim` argument to a layer. When using Sequential models, prefer using an `Input(shape)` object as the first layer in the model instead.
+  super().__init__(activity_regularizer=activity_regularizer, **kwargs)
+Model: "sequential_1"
+
+| Layer (type)                   | Output Shape       | Param # |
+| ------------------------------ | ------------------ | ------- |
+| conv2d_2 (Conv2D)              | (None, 30, 30, 32) | 896     |
+| max_pooling2d_2 (MaxPooling2D) | (None, 15, 15, 32) | 0       |
+| conv2d_3 (Conv2D)              | (None, 13, 13, 64) | 18,496  |
+| max_pooling2d_3 (MaxPooling2D) | (None, 6, 6, 64)   | 0       |
+| conv2d_4 (Conv2D)              | (None, 4, 4, 128)  | 73,856  |
+| max_pooling2d_4 (MaxPooling2D) | (None, 2, 2, 128)  | 0       |
+| flatten_1 (Flatten)            | (None, 512)        | 0       |
+| dense_1 (Dense)                | (None, 128)        | 65,664  |
+| dropout_1 (Dropout)            | (None, 128)        | 0       |
+| dense_2 (Dense)                | (None, 10)         | 1,290   |
+
+ Total params: 160,202 (625.79 KB)
+ Trainable params: 160,202 (625.79 KB)
+ Non-trainable params: 0 (0.00 B)
+```
+#### *6. Оценка качества на тестовой выборке CIFAR-10*
+
+```python
+scores_cifar = model_cifar.evaluate(X_test_c, y_test_c_cat, verbose=2)
+print('CIFAR - Loss on test data:', scores_cifar[0])
+print('CIFAR - Accuracy on test data:', scores_cifar[1])
+```
+```python
+313/313 - 8s - 26ms/step - accuracy: 0.6855 - loss: 0.8885
+CIFAR - Loss on test data: 0.8884508609771729
+CIFAR - Accuracy on test data: 0.6855000257492065
+```
+
+#### *7-8. Подать два тестовых изображения: одно верно, другое ошибочно. Вывести отчет о качестве классификации тестовой выборки и матрицу ошибок для тестовой выборки*
+
+```python
+print(classification_report(true_cifar, preds_cifar, target_names=class_names))
+
+conf_matrix_cifar = confusion_matrix(true_cifar, preds_cifar)
+display = ConfusionMatrixDisplay(confusion_matrix=conf_matrix_cifar,
+                                 display_labels=class_names)
+
+plt.figure(figsize=(10,10))   # figsize задаётся здесь
+display.plot(cmap='Blues', colorbar=False)  # без figsize
+plt.xticks(rotation=45)
+plt.show()
+```
+```python
+ precision    recall  f1-score   support
+
+    airplane       0.78      0.66      0.71      1000
+  automobile       0.82      0.81      0.81      1000
+        bird       0.61      0.55      0.58      1000
+         cat       0.49      0.43      0.46      1000
+        deer       0.62      0.67      0.64      1000
+         dog       0.51      0.71      0.59      1000
+        frog       0.81      0.73      0.77      1000
+       horse       0.72      0.71      0.71      1000
+        ship       0.77      0.82      0.80      1000
+       truck       0.80      0.76      0.78      1000
+
+    accuracy                           0.69     10000
+   macro avg       0.69      0.69      0.69     10000
+weighted avg       0.69      0.69      0.69     10000
+
+<Figure size 1000x1000 with 0 Axes>
+```
+![image](pics/i6.png)
+
+
+Для CIFAR-10 точность составила ~68.55%, что ниже, чем для MNIST, из-за большей сложности изображений (цветные, более сложные объекты).
+Видно, что классы cat и dog хуже распознаются (точность 0.49 и 0.51), а automobile, ship, truck распознаются лучше (~0.8).
+Матрица ошибок (ConfusionMatrixDisplay) позволяет визуально увидеть, какие классы чаще путаются между собой (например, cat и dog).
+
+## Вывод
+Проведенное исследование показало, что сверточные нейронные сети превосходят полносвязные модели в задачах распознавания изображений. Для MNIST сверточная сеть достигла точности 98,79% при меньшем числе параметров (34 826 против 89 610 у MLP), что обеспечивает более экономное использование памяти и снижает риск переобучения.
+
+На более сложном наборе CIFAR-10 сеть показала точность 68,55%, при этом объекты с визуально схожими признаками, например кошки и собаки, распознаются хуже, чем однозначные объекты, такие как автомобили и корабли. Результаты демонстрируют, что сверточные сети эффективно извлекают признаки из изображений и обеспечивают высокое качество классификации, особенно на структурированных данных, хотя для сложных цветных изображений требуется более глубокая архитектура или дополнительные методы улучшения обучения.