Mokhov Andrey 1 неделю назад
Родитель b5b773aff3
Сommit 32045e284c

@ -15,6 +15,7 @@
| [Сверточные нейронные сети](lections/OATD_lec_9.pdf) [pptx](lections/OATD_lec_9.pptx) <br /> [Рекуррентные нейронные сети](lections/OATD_lec_10.pdf) [pptx](lections/OATD_lec_10.pptx) | | [Сверточные нейронные сети](lections/OATD_lec_9.pdf) [pptx](lections/OATD_lec_9.pptx) <br /> [Рекуррентные нейронные сети](lections/OATD_lec_10.pdf) [pptx](lections/OATD_lec_10.pptx) |
| [Трансформеры](lections/OATD_lec_12.pdf) [pptx](lections/OATD_lec_12.pptx) | | [Трансформеры](lections/OATD_lec_12.pdf) [pptx](lections/OATD_lec_12.pptx) |
| [Решение задач выявления плагиата](lections/OATD_lec_11.pdf) [pptx](lections/OATD_lec_11.pptx) | | | [Решение задач выявления плагиата](lections/OATD_lec_11.pdf) [pptx](lections/OATD_lec_11.pptx) | |
| [Применение LLM. Промптинг, RAG-системы](lections/OATD_lec_13.pdf) [pptx](lections/OATD_lec_13.pptx) | |
## Журнал группы ## Журнал группы
@ -44,3 +45,10 @@
* [Задание](labs/OATD_LR4.ipynb) * [Задание](labs/OATD_LR4.ipynb)
## Экзамен
* [Программа курса](assets/TDA_exam_program.docx)
* [Примеры задач](assets/TDA_exam_tasks.docx)

Двоичные данные
assets/TDA_exam_program.docx

Двоичный файл не отображается.

Двоичные данные
assets/TDA_exam_tasks.docx

Двоичный файл не отображается.

@ -11,8 +11,7 @@
2. Импортировать необходимые для работы библиотеки и модули 2. Импортировать необходимые для работы библиотеки и модули
3. Загрузить обучающую и экзаменационную выборку в соответствие с вариантом 3. Загрузить обучающую и экзаменационную выборку в соответствие с вариантом
4. Вывести на экран по одному-два документа каждого класса. 4. Вывести на экран по одному-два документа каждого класса.
5. Применить стемминг, записав обработанные выборки (тестовую и обучающую) в новые переменные 5. Провести векторизацию выборки:
6. Провести векторизацию выборки:
A. Векторизовать обучающую и тестовую выборки простым подсчетом слов (CountVectorizer) A. Векторизовать обучающую и тестовую выборки простым подсчетом слов (CountVectorizer)
@ -20,9 +19,11 @@
C. Применить процедуру отсечения стоп-слов и повторить пункт B. C. Применить процедуру отсечения стоп-слов и повторить пункт B.
D. Провести пункт A для обучающей и тестовой выборки, для которой выполнен стемминг. D. Применить стемминг, записав обработанные выборки (тестовую и обучающую) в новые переменные
7. Рассчитать сходство по коэффициенту Жаккара между тремя классами для исходых выборок и для выборок после отсечения стоп-слов. При подсчете использовать все слова выборки. E. Провести пункт A для обучающей и тестовой выборки, для которой выполнен стемминг.
6. Рассчитать сходство по коэффициенту Жаккара между тремя классами для исходых выборок и для выборок после отсечения стоп-слов. При подсчете использовать все слова выборки.
7. Используя конвейер (Pipeline) реализовать модель Наивного Байесовского классификатора и выявить на основе показателей качества 7. Используя конвейер (Pipeline) реализовать модель Наивного Байесовского классификатора и выявить на основе показателей качества
(значения полноты, точности, f1-меры и аккуратности), какая предварительная обработка данных обеспечит наилучшие результаты классификации. (значения полноты, точности, f1-меры и аккуратности), какая предварительная обработка данных обеспечит наилучшие результаты классификации.
Должны быть исследованы следующие характеристики: Должны быть исследованы следующие характеристики:

Двоичные данные
lections/OATD_lec_13.pdf

Двоичный файл не отображается.

Двоичные данные
lections/OATD_lec_13.pptx

Двоичный файл не отображается.
Загрузка…
Отмена
Сохранить