lec_13 and exams
Этот коммит содержится в:
@@ -15,6 +15,7 @@
|
||||
| [Сверточные нейронные сети](lections/OATD_lec_9.pdf) [pptx](lections/OATD_lec_9.pptx) <br /> [Рекуррентные нейронные сети](lections/OATD_lec_10.pdf) [pptx](lections/OATD_lec_10.pptx) |
|
||||
| [Трансформеры](lections/OATD_lec_12.pdf) [pptx](lections/OATD_lec_12.pptx) |
|
||||
| [Решение задач выявления плагиата](lections/OATD_lec_11.pdf) [pptx](lections/OATD_lec_11.pptx) | |
|
||||
| [Применение LLM. Промптинг, RAG-системы](lections/OATD_lec_13.pdf) [pptx](lections/OATD_lec_13.pptx) | |
|
||||
|
||||
## Журнал группы
|
||||
|
||||
@@ -44,3 +45,10 @@
|
||||
|
||||
* [Задание](labs/OATD_LR4.ipynb)
|
||||
|
||||
|
||||
## Экзамен
|
||||
|
||||
* [Программа курса](assets/TDA_exam_program.docx)
|
||||
* [Примеры задач](assets/TDA_exam_tasks.docx)
|
||||
|
||||
|
||||
|
||||
Двоичные данные
assets/TDA_exam_program.docx
Двоичные данные
assets/TDA_exam_program.docx
Двоичный файл не отображается.
Двоичные данные
assets/TDA_exam_tasks.docx
Двоичные данные
assets/TDA_exam_tasks.docx
Двоичный файл не отображается.
@@ -11,18 +11,19 @@
|
||||
2. Импортировать необходимые для работы библиотеки и модули
|
||||
3. Загрузить обучающую и экзаменационную выборку в соответствие с вариантом
|
||||
4. Вывести на экран по одному-два документа каждого класса.
|
||||
5. Применить стемминг, записав обработанные выборки (тестовую и обучающую) в новые переменные
|
||||
6. Провести векторизацию выборки:
|
||||
5. Провести векторизацию выборки:
|
||||
|
||||
A. Векторизовать обучающую и тестовую выборки простым подсчетом слов (CountVectorizer)
|
||||
|
||||
B. Вывести и проанализировать первые 20 наиболее частотных слов всей выборки и каждого класса по-отдельности.
|
||||
|
||||
C. Применить процедуру отсечения стоп-слов и повторить пункт B.
|
||||
|
||||
D. Провести пункт A для обучающей и тестовой выборки, для которой выполнен стемминг.
|
||||
|
||||
7. Рассчитать сходство по коэффициенту Жаккара между тремя классами для исходых выборок и для выборок после отсечения стоп-слов. При подсчете использовать все слова выборки.
|
||||
D. Применить стемминг, записав обработанные выборки (тестовую и обучающую) в новые переменные
|
||||
|
||||
E. Провести пункт A для обучающей и тестовой выборки, для которой выполнен стемминг.
|
||||
|
||||
6. Рассчитать сходство по коэффициенту Жаккара между тремя классами для исходых выборок и для выборок после отсечения стоп-слов. При подсчете использовать все слова выборки.
|
||||
7. Используя конвейер (Pipeline) реализовать модель Наивного Байесовского классификатора и выявить на основе показателей качества
|
||||
(значения полноты, точности, f1-меры и аккуратности), какая предварительная обработка данных обеспечит наилучшие результаты классификации.
|
||||
Должны быть исследованы следующие характеристики:
|
||||
|
||||
Двоичные данные
lections/OATD_lec_13.pdf
Обычный файл
Двоичные данные
lections/OATD_lec_13.pdf
Обычный файл
Двоичный файл не отображается.
Двоичные данные
lections/OATD_lec_13.pptx
Обычный файл
Двоичные данные
lections/OATD_lec_13.pptx
Обычный файл
Двоичный файл не отображается.
Ссылка в новой задаче
Block a user