Вы не можете выбрать более 25 тем
Темы должны начинаться с буквы или цифры, могут содержать дефисы(-) и должны содержать не более 35 символов.
3.0 KiB
3.0 KiB
Лабораторная работа №4. Использование нейронных сетей для генерации текста
Цель работы
Получить практические навыки решения задачи генерации текста.
Задание
- Загрузить выборку стихотворений одного из поэтов в соответствии с вариантом.
- Познакомиться с данными. Проанализировать статистические характеристики исходных данных (среднюю длину стихотворения, среднюю длину строки).
- Подготовить выборку для обучения.
- Построить нейронную сеть. Тип ячейки RNN выбрать в соответствии с вариантом.
- Обучить нейронную сеть на разных количествах эпох (5, 15, 30, 50, 70) при зафиксированных параметрах embedding_dim = 256, rnn_units = 300, T = 0.3 и сравнить результаты генерации (тексты), перплексию и статистические характеристики сгенерированных текстов. Выбрать оптимальное количество эпох
- Изменяя параметр температуры T проанализировать изменения сгенерированного текста. Выбрать оптимальное значение параметра.
- Проанализировать зависимость перплексии, скорости обучения, результатов генерации от параметров нейронной сети embedding_dim, rnn_units:
embedding_dim = {vocab/4, vocab/2, vocab, vocab * 2, vocab * 4}, где vocab = размер словаря выборки.
rnn_units = {10, 100, 300, 500}
Указания
Для работы рекомендуется использовать Google Colab вместо Jupyter Notebook для ускорения расчетов.
Варианты заданий
Поэт
Четные номера по журналу - Пушкин, нечетные - Маяковский.
Тип ячейки RNN
Остаток от деления номера по журналу на 3:
- 0 - https://keras.io/api/layers/recurrent_layers/simple_rnn/
- 1 - https://keras.io/api/layers/recurrent_layers/lstm/
- 2 - https://keras.io/api/layers/recurrent_layers/gru/
Контрольные вопросы
- В чем особенность рекуррентных нейронных сетей?
- Типы рекуррентных сетей - обычная RNN
- Типы рекуррентных сетей - LSTM
- Типы рекуррентных сетей - GRU
- Что такое и как вычисляется перплексия