Skip to content
New issue

Have a question about this project? Sign up for a free GitHub account to open an issue and contact its maintainers and the community.

By clicking “Sign up for GitHub”, you agree to our terms of service and privacy statement. We’ll occasionally send you account related emails.

Already on GitHub? Sign in to your account

added kharchenko data #15

Open
wants to merge 6 commits into
base: main
Choose a base branch
from
Open

added kharchenko data #15

wants to merge 6 commits into from

Conversation

MarrynaKh
Copy link
Collaborator

Марина Харченко додає свої дані

@your-lithium
Copy link
Collaborator

у файлах нема посилань на пости

Copy link
Collaborator

@your-lithium your-lithium left a comment

Choose a reason for hiding this comment

The reason will be displayed to describe this comment to others. Learn more.

є трошки проблем із обробкою результатів і їхнім збереженням. виправ, будь ласочка. також зверни увагу, що у файлах із постами нема посилань на самі пости, які Ярина просила всюди мати


pattern = r"([a-z]|ы|ъ|э){1,10}"

for name in os.listdir(data_directory):
Copy link
Collaborator

Choose a reason for hiding this comment

The reason will be displayed to describe this comment to others. Learn more.

не треба знову відкривати файли. функціонал для цього вже існує, файли вже зчитані і є змінні із зчитаними даними, почитай, будь ласка, документацію:
# self.texts_old = усі тексти з теки old
# self.texts_new = усі тексти з теки new
# self.posts_old = окремі пости з теки old
# self.posts_new = окремі пости з теки new
# self.sentences_old = окремі речення з теки old
# self.sentences_new = окремі речення з теки new
# self.words_old = окремі слова з теки old
# self.words_new = окремі слова з теки new

first = max(0, contents.find(match) -20)
last = min(len(contents), contents.find(match) +20)
context = contents[first:last]
print(f"{name}: {context}")
Copy link
Collaborator

Choose a reason for hiding this comment

The reason will be displayed to describe this comment to others. Learn more.

по-перше, не треба нічого прінтити

по-друге, треба, як у інших функцій, створити змінну, у яку зберігатимуться готові дані. наприклад, пошукай у файлі, де згадується змінна self.rule_posts_per_day_result -- вперше вона впринципі засновується, вдруге вона у відповідній функції власне визначається і втретє її значення зберігається

по-третє, результатом функції має бути певне кількісне значення -- наприклад, кількість слів російською/англійською, які за відповідний місяць людина написала у постах

Sign up for free to join this conversation on GitHub. Already have an account? Sign in to comment
Labels
None yet
Projects
None yet
Development

Successfully merging this pull request may close these issues.

2 participants