오늘은 금요일이기도 하고, 국경절 전날이라서 기분이 상쾌하다. (사실 대학원생에게 어차피 수업도 없어서 국경절은 아무것도 아니긴 하지만^^..)

내일부터 조금 그나마 더 쉴 수 있으니 오늘도 빡세게 달려보려고 한다. 오늘 할 것들을 정리하면, Safety Control Gym 돌릴 수 있는 환경 설치하기.

제약조건 강화학습 알고리즘에 손실함수 바꿔가면서 성능 확인하기. 내가 생각한 손실함수 설계해서 적용해보고 성능 확인해보기.

A,B 비교하는 논문 다시 한번 읽어보기....