UNZYP은 오늘의 집에 있는 압축된 상품을 추천을 통해 unzip하겠다는 의미로, 오늘의 집 상품 기반의 집 꾸미기 상품 추천 서비스입니다.
오늘의 집은 국내 최대 온라인 집 꾸미기 상품 판매 사이트이며, 기업 가치는 2조원대로 오프라인 업체의 규모를 넘어섰습니다.1 2020년 3월 이후 오늘의 집 검색량이 급증하였으며2, 코로나로 인해 외출을 꺼리게 되었고, 급격한 집값 상승으로 인해 리모델링이나 인테리어로 관심이 이동되는 것이 이유로 추정됩니다. 이러한 내용을 토대로 오늘의 집에 대한 시장성이 충분히 있다고 판단하여 해당 프로젝트를 진행하였습니다.
UNZYP 웹 서비스를 통해 다양한 접근으로 유저가 선호할 만한 상품을 추천하여 효율적으로 상품을 탐색할 수 있도록 하고자 합니다. 또한 각 상품에 대한 리뷰 요약 정보를 제공하여 상품 구매 여부를 결정하는데 도움을 주는 효과를 기대합니다.
- 회원가입 시 유저가 남긴 선호 상품 리스트와 오늘의 집 리뷰 데이터 기반으로 추천합니다.
- 개인화 추천 이외에 유저가 선택한 가격대와 상품 카테고리를 기반으로 인기있는 상품을 추천합니다.
- 유저 interaction을 기반으로 유사한 유저의 상품을 추천합니다.
- 선택한 상품의 상세 정보를 제공합니다. 기본적인 정보와 더불어 유사한 유저 n명이 만족한 비율을 노출합니다.
- wordcloud 형식으로 별점대 별 해당 상품의 리뷰 요약 정보를 제공합니다.
- 해당 상품과 유사한 상품을 추천합니다.
- [오늘의 집] > [커뮤티니] > [집들이] 페이지 정보와 상품 id 수집
- item side information: 수집된 상품 id 에 대한 상세 정보 수집
- 유저-아이템 interaction: 상품 리뷰 데이터 수집
※ 데이터 분석 결과에 관한 자세한 내용은 EDA 파일을 참고해주세요.
유저의 오늘의 집 리뷰 이력과 언집에서 남긴 선호 상품 이력을 기반으로 Autoencoder 계열 모델과 sequence 계열 모델을 학습하고, 검증 결과에 따라 평가 지표(Hit@10) 값과 학습 상태를 고려하여 모델을 선정합니다. 오늘의 집 리뷰 이력이 없는 cold-start 유저가 대부분일 것이라 판단하여 유저 id 에 종속적이지 않은 Autoencode 계열 모델과 sequence 계열 모델을 사용하였습니다. 검증 결과, 안정적으로 학습이 되면서 좋은 성능을 보인 RecVAE 모델을 최종 모델로 결정하였습니다.
인기도 기반 추천에서는 모델을 사용하지 않고 자체 로직을 통해 추천합니다. 상품 평점과 리뷰 수를 기준으로 인기 상품을 선정한 후 유저가 선택한 상품 카테고리로 필터링하여 추천 결과를 반환합니다.
방법론 | 참조 |
---|---|
ALS(Alternating Least Squares) MF | Yifan Hu, Yehuda Koren, and Chris Volinsky. 2008. Collaborative Filtering for Implicit Feedback Datasets |
ALS를 통해 유저 Latent Vector 를 생성하고, NNS(Nearest Neighbor Similarity)를 통해 유사 유저들을 식별합니다. 이후 유사한 유저들과 interaction이 있었던 상품들을 추천합니다.
Item2Vec을 통해 상품 Latent Vector를 학습하고, NNS 를 통해 해당 상품과 유사한 상품 추천합니다.
강민수 | 김진명 | 박경태 | 박용욱 |
데이터 수집 & 전처리 개인화 추천 모델링 |
데이터 수집 & 전처리 개인화 추천 모델링 백엔트 API |
데이터 수집 프론트엔드 개인화 추천 모델링 |
데이터 수집 프론트엔드 백엔드 개인화 추천 모델링 |
2. Naver Datalab - 검색어 트렌드 월별 오늘의 집 검색어 트렌드를 보면 2020.03 검색량이 급증한 것을 확인할 수 있음 ↩