Skip to content
New issue

Have a question about this project? Sign up for a free GitHub account to open an issue and contact its maintainers and the community.

By clicking “Sign up for GitHub”, you agree to our terms of service and privacy statement. We’ll occasionally send you account related emails.

Already on GitHub? Sign in to your account

fix: Incorrect text in the README.md. #2

Open
wants to merge 1 commit into
base: main
Choose a base branch
from
Open
Changes from all commits
Commits
File filter

Filter by extension

Filter by extension

Conversations
Failed to load comments.
Loading
Jump to
Jump to file
Failed to load files.
Loading
Diff view
Diff view
2 changes: 1 addition & 1 deletion README.md
Original file line number Diff line number Diff line change
Expand Up @@ -25,7 +25,7 @@ AutoRAG 사용을 위하여 먼저 RAG 평가 데이터셋을 제작해야 합
1. `raw_docs`에서 원본 문서를 확인합니다. 이 튜토리얼에서는 세 개의 pdf 문서를 이용하고자 합니다.
2. `run_parse.py`를 실행합니다. 이 파일을 통해서 `config/parse.yaml`에 기입된 방법들을 통해 파싱을 실행하고, 그 결과를 비교할 수 있습니다.
```bash
python make_parse.py
python run_parse.py
```
3. `parsed_raw` 폴더 내에 생성된 trial 폴더 (숫자 폴더) 내에서 여러 parquet 파일들을 확인할 수 있습니다. 이것들이 파싱된 결과입니다. `pandas`를 통해 load하여 직접 확인해보세요.
4. `run_chunk.py`를 실행하여 여러 방법으로 청킹을 수행합니다. `config/chunk.yaml`에서 청킹 방법들을 확인할 수 있습니다. 이 때 raw 파일을 설정해야 합니다.
Expand Down