Skip to content
New issue

Have a question about this project? Sign up for a free GitHub account to open an issue and contact its maintainers and the community.

By clicking “Sign up for GitHub”, you agree to our terms of service and privacy statement. We’ll occasionally send you account related emails.

Already on GitHub? Sign in to your account

442 theme in text #456

Merged
merged 6 commits into from
Apr 23, 2024
Merged

442 theme in text #456

merged 6 commits into from
Apr 23, 2024

Conversation

MarinaProsche
Copy link
Collaborator

Реализована простая проверка для поиска темы в отчете и презентации:

Ищется пересечение двух множеств: множества лемм из темы и множества лемм всего текста (за исключением некоторых ненужных страниц).
Далее находится отношение пересечения к множеству темы (используется функция len())

Минимум взят 60% исходя из аналогичных проверок

Comment on lines +38 to +45
for intro in self.chapters:
header = intro["text"].lower()
if header not in ['заключение', "введение", "список использованных источников", "условные обозначения"]:
self.intro = intro
for intro_par in self.intro['child']:
par = intro_par['text'].lower()
self.text_par.append(par)
lemma_theme = self.find_theme()
Copy link
Collaborator

@HadronCollider HadronCollider Jul 30, 2023

Choose a reason for hiding this comment

The reason will be displayed to describe this comment to others. Learn more.

Я в процессе небольшой разработки/обновления представления текста отчета для проверок (простая структура вида

{
    'chapter_name': '...',
    'text': 'full chapter text'
}

чтобы избавиться от всяких списков параграфов и прочего. аналогично с презентациями (если там такого нет)

Если не успею сделать - пока оставим так

@github-actions github-actions bot added the has conflicts if new merge has conflicts label Feb 19, 2024
@github-actions github-actions bot removed the has conflicts if new merge has conflicts label Apr 23, 2024
@HadronCollider HadronCollider merged commit e38c850 into master Apr 23, 2024
3 checks passed
Sign up for free to join this conversation on GitHub. Already have an account? Sign in to comment
Labels
None yet
Projects
None yet
Development

Successfully merging this pull request may close these issues.

2 participants