-
Notifications
You must be signed in to change notification settings - Fork 0
New issue
Have a question about this project? Sign up for a free GitHub account to open an issue and contact its maintainers and the community.
By clicking “Sign up for GitHub”, you agree to our terms of service and privacy statement. We’ll occasionally send you account related emails.
Already on GitHub? Sign in to your account
added kharchenko data #15
base: main
Are you sure you want to change the base?
Conversation
у файлах нема посилань на пости |
There was a problem hiding this comment.
Choose a reason for hiding this comment
The reason will be displayed to describe this comment to others. Learn more.
є трошки проблем із обробкою результатів і їхнім збереженням. виправ, будь ласочка. також зверни увагу, що у файлах із постами нема посилань на самі пости, які Ярина просила всюди мати
processing/analyses.py
Outdated
|
||
pattern = r"([a-z]|ы|ъ|э){1,10}" | ||
|
||
for name in os.listdir(data_directory): |
There was a problem hiding this comment.
Choose a reason for hiding this comment
The reason will be displayed to describe this comment to others. Learn more.
не треба знову відкривати файли. функціонал для цього вже існує, файли вже зчитані і є змінні із зчитаними даними, почитай, будь ласка, документацію:
# self.texts_old = усі тексти з теки old
# self.texts_new = усі тексти з теки new
# self.posts_old = окремі пости з теки old
# self.posts_new = окремі пости з теки new
# self.sentences_old = окремі речення з теки old
# self.sentences_new = окремі речення з теки new
# self.words_old = окремі слова з теки old
# self.words_new = окремі слова з теки new
processing/analyses.py
Outdated
first = max(0, contents.find(match) -20) | ||
last = min(len(contents), contents.find(match) +20) | ||
context = contents[first:last] | ||
print(f"{name}: {context}") |
There was a problem hiding this comment.
Choose a reason for hiding this comment
The reason will be displayed to describe this comment to others. Learn more.
по-перше, не треба нічого прінтити
по-друге, треба, як у інших функцій, створити змінну, у яку зберігатимуться готові дані. наприклад, пошукай у файлі, де згадується змінна self.rule_posts_per_day_result
-- вперше вона впринципі засновується, вдруге вона у відповідній функції власне визначається і втретє її значення зберігається
по-третє, результатом функції має бути певне кількісне значення -- наприклад, кількість слів російською/англійською, які за відповідний місяць людина написала у постах
Марина Харченко додає свої дані