diff --git a/README.md b/README.md index 028bf76..5e50a9f 100644 --- a/README.md +++ b/README.md @@ -15,6 +15,7 @@ | [Сверточные нейронные сети](lections/OATD_lec_9.pdf) [pptx](lections/OATD_lec_9.pptx)
[Рекуррентные нейронные сети](lections/OATD_lec_10.pdf) [pptx](lections/OATD_lec_10.pptx) | | [Трансформеры](lections/OATD_lec_12.pdf) [pptx](lections/OATD_lec_12.pptx) | | [Решение задач выявления плагиата](lections/OATD_lec_11.pdf) [pptx](lections/OATD_lec_11.pptx) | | +| [Применение LLM. Промптинг, RAG-системы](lections/OATD_lec_13.pdf) [pptx](lections/OATD_lec_13.pptx) | | ## Журнал группы @@ -44,3 +45,10 @@ * [Задание](labs/OATD_LR4.ipynb) + +## Экзамен + +* [Программа курса](assets/TDA_exam_program.docx) +* [Примеры задач](assets/TDA_exam_tasks.docx) + + diff --git a/assets/TDA_exam_program.docx b/assets/TDA_exam_program.docx index 74e2193..3b7e223 100644 Binary files a/assets/TDA_exam_program.docx and b/assets/TDA_exam_program.docx differ diff --git a/assets/TDA_exam_tasks.docx b/assets/TDA_exam_tasks.docx index 49cea90..41bc720 100644 Binary files a/assets/TDA_exam_tasks.docx and b/assets/TDA_exam_tasks.docx differ diff --git a/labs/OATD_LR2.md b/labs/OATD_LR2.md index 6669a68..8165992 100644 --- a/labs/OATD_LR2.md +++ b/labs/OATD_LR2.md @@ -11,18 +11,19 @@ 2. Импортировать необходимые для работы библиотеки и модули 3. Загрузить обучающую и экзаменационную выборку в соответствие с вариантом 4. Вывести на экран по одному-два документа каждого класса. -5. Применить стемминг, записав обработанные выборки (тестовую и обучающую) в новые переменные -6. Провести векторизацию выборки: +5. Провести векторизацию выборки: A. Векторизовать обучающую и тестовую выборки простым подсчетом слов (CountVectorizer) B. Вывести и проанализировать первые 20 наиболее частотных слов всей выборки и каждого класса по-отдельности. C. Применить процедуру отсечения стоп-слов и повторить пункт B. + + D. Применить стемминг, записав обработанные выборки (тестовую и обучающую) в новые переменные - D. Провести пункт A для обучающей и тестовой выборки, для которой выполнен стемминг. + E. Провести пункт A для обучающей и тестовой выборки, для которой выполнен стемминг. -7. Рассчитать сходство по коэффициенту Жаккара между тремя классами для исходых выборок и для выборок после отсечения стоп-слов. При подсчете использовать все слова выборки. +6. Рассчитать сходство по коэффициенту Жаккара между тремя классами для исходых выборок и для выборок после отсечения стоп-слов. При подсчете использовать все слова выборки. 7. Используя конвейер (Pipeline) реализовать модель Наивного Байесовского классификатора и выявить на основе показателей качества (значения полноты, точности, f1-меры и аккуратности), какая предварительная обработка данных обеспечит наилучшие результаты классификации. Должны быть исследованы следующие характеристики: diff --git a/lections/OATD_lec_13.pdf b/lections/OATD_lec_13.pdf new file mode 100644 index 0000000..d3d675c Binary files /dev/null and b/lections/OATD_lec_13.pdf differ diff --git a/lections/OATD_lec_13.pptx b/lections/OATD_lec_13.pptx new file mode 100644 index 0000000..517e61b Binary files /dev/null and b/lections/OATD_lec_13.pptx differ