[강화학습 - Safe RL] safe-control-gym 사용법 정리
해당 환경이 풀고자 하는 문제 해당 라이브러리는 위 문제를 풀기 위한 환경과 세팅을 제공한다. 그리고 안전 제어는 아래처럼 이전의 경험과 데이터가 들어가 정책이 맵핑되는 구조이다. 환경 수정 환경별 YAML 파일 안에서 환경과 관련된 속성들 변경 가능. 제약조건, 방해, 제어 주파수 등등 여기서 수정이 가능하다. 따라서 환경의 인터페이스는 Symbolic models (역학모델) Constraint specification (제약조건 설정) Disturbance injection (방해 주입) 이다. 환경에 대한 데이터 수집 env.reset()을 통해 환경 초기화, env.step()을 통해 다음 스텝에서의 정보를 수집할 수 있다. 제어기 종류 제어기는 위의 11가지가 존재하며, 갖다쓰면 된다. 각각의 모델 구조 예를 들어 rMPC를 활용한다고 할 때, 위의 Cost function, Dynamics, 그리고 Constraints를 위에 표시된 공간에 수정을 해줘야 한다. Lear