diff --git a/labworks/LW4/readme.md b/labworks/LW4/readme.md index 2ac35ae..ccfb8e5 100644 --- a/labworks/LW4/readme.md +++ b/labworks/LW4/readme.md @@ -17,7 +17,6 @@ print('Found GPU at: {}'.format(device_name)) ``` Found GPU at: /device:GPU:0 ### 2) Загрузили набор данных IMDb, содержащий оцифрованные отзывы на фильмы, размеченные на два класса: позитивные и негативные. При загрузке набора данных параметр seed выбрали равным значению (4k – 1)=27, где k=7 – номер бригады. Вывели размеры полученных обучающих и тестовых массивов данных. -# загрузка датасета ```python from keras.datasets import imdb @@ -48,9 +47,9 @@ Shape of y train: (25000,) Shape of X test: (25000,) Shape of y test: (25000,) ### 3) Вывели один отзыв из обучающего множества в виде списка индексов слов. Преобразовали список индексов в текст и вывели отзыв в виде текста. Вывели длину отзыва. Вывели метку класса данного отзыва и название класса (1 – Positive, 0 – Negative). +```python # создание словаря для перевода индексов в слова # заргузка словаря "слово:индекс" -```python word_to_id = imdb.get_word_index() # уточнение словаря word_to_id = {key:(value + index_from) for key,value in word_to_id.items()} @@ -84,7 +83,6 @@ print('MIN Len: ',len(min(X_train, key=len))) MAX Len: 2494 MIN Len: 11 ### 5) Провели предобработку данных. Выбрали единую длину, к которой будут приведены все отзывы. Короткие отзывы дополнили спецсимволами, а длинные обрезали до выбранной длины. -# предобработка данных ```python from tensorflow.keras.utils import pad_sequences max_words = 500