Home
Younghun Ko
Cancel

// Recent Posts

53 posts
2026
2025
Sep 05

[Paper Review] Proximal Policy Optimization Algorithms (PPO)

Introduction 강화학습에서 정책 경사(policy gradient) 방법은 높은 표현력과 범용성을 갖추고 있으나, 샘플 효율성이 낮고 학습이 불안정하다는 한계가 있다. Trust Region Poli...

Paper Review #paper-review #reinforcement-learning #policy-gradient
5 min
Jan 04

[Paper Review] Integrating Random Effects in Deep Neural Networks

Introduction 계층적 데이터셋(hierarchical datasets)에서는 데이터 포인트가 그룹으로 묶인다 (예: 학교별 학생, 병원별 환자). 이러한 데이터에서 그룹별 변동성(group-speci...

Paper Review #paper-review #deep-learning #statistics
3 min