본 프로젝트는 V2G(Vehicle-to-Grid) 환경에서 전력거래 이익을 최대화하기 위한 강화학습 기반 솔루션을 제안합니다. EV2Gym 시뮬레이션 환경을 활용하여 다양한 강화학습 알고리즘의 성능을 평가하고, 최적의 충방전 전략을 개발했습니다.
- 신재생 에너지 비중 확대에 따른 전력 공급 과잉 문제 발생
- 전기차 보급 확대에 따른 V2G 시스템 활용 가능성 증가
- V2G 환경에서 강화학습을 통한 최적 충방전 전략 개발
- EV 사용자와 그리드 관리자 모두의 이익을 고려한 통합 솔루션 제시
- 배터리 수명과 충전 만족도를 고려한 경제적 운영 방안 도출
김도균 |
|
배레온 |
|
-
EV2Gym: A Flexible V2G Simulator for EV Smart Charging Research and Benchmarking - Orfanoudakis, S., Diaz-Londono, C., Yılmaz, Y. E., Palensky, P., & Vergara, P. P. (2024). arXiv:2404.01849 [cs.SE].
-
Soft Actor-Critic: Off-Policy Maximum Entropy Deep Reinforcement Learning with a Stochastic Actor - Haarnoja, T., Zhou, A., Abbeel, P., & Levine, S. (2018). International Conference on Machine Learning (ICML).
-
Trust Region Policy Optimization - Schulman, J., Levine, S., Abbeel, P., Jordan, M., & Moritz, P. (2015). International Conference on Machine Learning (ICML).
-
Proximal Policy Optimization Algorithms - Schulman, J., Wolski, F., Dhariwal, P., Radford, A., & Klimov, O. (2017).