-
Notifications
You must be signed in to change notification settings - Fork 2
New issue
Have a question about this project? Sign up for a free GitHub account to open an issue and contact its maintainers and the community.
By clicking “Sign up for GitHub”, you agree to our terms of service and privacy statement. We’ll occasionally send you account related emails.
Already on GitHub? Sign in to your account
DB count query 추가 #237
Comments
이건 어떤 목적에 쓰일 건가요? @sehkone, @syncpark: 이런 류의 query가 꼭 필요한가요? 아무 제한 조건 없이 전체 개수를 세는 작업은 다음과 같은 문제가 있습니다.
|
|
그럼 GraphQL 쿼리가 아닌 거네요. 처음 이슈 올라왔을 때 "... query를 구현합니다"로 되어 있어서 웹 클라이언트에서 접근 가능한 GraphQL 쿼리를 구현한다고 생각했습니다. 여전히 count가 필요한가에 대해서는 아직 납득이 안 되는데요, "비정상인 상황 혹은 해당 DB에 처음으로 접근하는 엔지니어가 DB의 상태를 확인하고자 할 때" column family별로 몇 개씩 들어가있는지를 알면 어떤 대응을 할 수 있나요? 데이터 개수가 아니라 column family별로 사용하는 디스크 스페이스로는 안되나요? 그리고 이 기능이 UI와 연동하지 않는 기능이면 3번의 경우는 클러스터링을 하기 전에 "CLI 등을 통해서 상태확인"을 한 다음 개수를 파악해서 하는 건가요? |
column family 별로 사용하는 디스크 용량을 알 수 있는 방법이 있나요? 그렇다면 사용중인 크기와 이벤트의 평균 크기를 비교해서 대략적인 이벤트 건수를 확인하는 방법으로 이벤트 건수를 계산하는 방법이겠네요? 대부분 시스템소프트웨어들은 비상 상황 (혹은 장애 상황)이 발생했을 때를 대비해서 UI가 아닌 다른 방법으로 시스템의 자세한 상황 파악이 가능한 도구들을 제공합니다. 그래서 여러 통계 기능과 Count 기능들을 그런 용도로 사용하고자 합니다. 또한 지금 당장 시험할 때도 DB에 어느정도의 데이터가 들어있는지 알 수 있는 방법이 없습니다. REconverge를 실행해서 몇 라운드 동안 어느정도의 데이터를 분석했으니 몇 건 정도의 데이터가 들어있을 거다...이렇게 판단하기에는 너무 시간이 많이 걸립니다. 그리고 전체 건수를 알아야 period와 batch size등을 적당하게 설정할 수 있지 않을까요? |
현재 두 가지 다른 목적이 있습니다.
우선 2번과 관련해서는 Giganto가 보내는 데이터를 REconverge가 다 처리하고 있는지를 파악하는 것으로 해결해야 맞는 것 같습니다. 즉, Giganto에서 해야할 일이 아니라 REconvege가 해야할 일로 생각됩니다. 1번과 관련해서도 시스템의 상황 파악이므로 시스템이 파악해야지 Giganto가 파악하면 안 될 것 같습니다. 다만, 1과 2의 목적이 아니라 Giganto에 저장된 데이터의 양 등 상세 정보를 파악하는 별도의 목적이 있을 수는 있겠습니다. 이러한 목적이 앞의 1과 2와 구별되는 별도의 목적인지를 명확히 하고, 그런 경우에 한해서 Giganto에 필요 기능을 넣어야 할 것 같습니다. |
database의 특정 column family에 들어가 있는 raw data의 총 갯수를 반환해주는 query를 구현합니다.
query의 입력값은 column family의 이름(
Option<Vec<String>>
) 입니다. 이름을 지정하지 않는 경우에는 모든 column family에 대한 count 결과를 반환하도록 합니다.The text was updated successfully, but these errors were encountered: