fix:tokenized_path not None and load_from_disk return Dataset Trigger… #6160

village-way · 2024-11-27T08:48:10Z

What does this PR do?

when config tokenized_path and load_from_disk(data_args.tokenized_path) is Dataset
it may stack very long time in the code if "train" in dataset_dict:, because the dataset maybe very large.

Fixes # (issue)

Before submitting

Did you read the contributor guideline?
Did you write any new necessary tests?

… stuck

fix:tokenized_path not None and load_from_disk return Dataset Trigger…

4424d4d

… stuck

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

fix:tokenized_path not None and load_from_disk return Dataset Trigger… #6160

fix:tokenized_path not None and load_from_disk return Dataset Trigger… #6160

village-way commented Nov 27, 2024 •

edited

Loading

fix:tokenized_path not None and load_from_disk return Dataset Trigger… #6160

Are you sure you want to change the base?

fix:tokenized_path not None and load_from_disk return Dataset Trigger… #6160

Conversation

village-way commented Nov 27, 2024 • edited Loading

What does this PR do?

Before submitting

village-way commented Nov 27, 2024 •

edited

Loading