Younghun Ko

// Recent Posts

53 posts

2026

Jan 10

[Paper Review] KLUE: Korean Language Understanding Evaluation

Introduction Park et al. (2021)의 KLUE(Korean Language Understanding Evaluation)는 한국어 자연어 이해(NLU) 모델을 체계적으로 평가하기 위한 벤...

Paper Review #paper-review #nlp #korean-nlp

6 min

Jan 10

[파이썬 아키텍처] CH00 - Prerequisites (책을 읽기 전에)

Introduction Architecture Patterns with Python (Harry Percival & Bob Gregory, O’Reilly — 일명 Cosmic Python)은 DDD ...

Study Note #python #architecture #prerequisites

25 min

2025

Dec 20

[Paper Review] Multilingual E5 Text Embeddings: A Technical Report

Introduction Wang et al. (2024)의 mE5(Multilingual E5)는 100개 이상의 언어를 지원하는 범용 텍스트 임베딩 모델이다. 정보 검색(IR), 검색 증강 생성(RAG), ...

Paper Review #paper-review #nlp #text-embeddings

6 min

Dec 03

[Paper Review] KTO: Model Alignment as Prospect Theoretic Optimization

Introduction Ethayarajh et al. (2024)의 KTO(Kahneman-Tversky Optimization)는 대규모 언어 모델(LLM) 정렬(alignment)에서 기존 DPO가 요구...

Paper Review #paper-review #preference-learning #llm-alignment

6 min

Nov 15

[Paper Review] Direct Preference Optimization: Your Language Model is Secretly a Reward Model

Introduction 대규모 언어 모델(LLM)의 정렬(alignment)을 위한 표준 파이프라인은 RLHF(Reinforcement Learning from Human Feedback)로, SFT(Supe...

Paper Review #paper-review #reinforcement-learning #preference-learning

6 min

Oct 10

[Paper Review] A Contextual-Bandit Approach to Personalized News Article Recommendation

Introduction 웹 서비스에서 개인화 추천은 사용자의 문맥(context) 정보를 활용하여 최적의 콘텐츠를 선택하는 문제로 정의할 수 있다. 기존의 추천 시스템은 대부분 탐색(exploration)과 ...

Paper Review #paper-review #reinforcement-learning #contextual-bandits

27 min

Sep 22

[Paper Review] Matrix Factorization Techniques for Recommender Systems

Introduction 추천 시스템은 크게 콘텐츠 기반 필터링(content-based filtering)과 협업 필터링(collaborative filtering)으로 나뉜다. 콘텐츠 기반 방법은 아이템의 ...

Paper Review #paper-review #recommender-system #matrix-factorization

6 min

Sep 05

[Paper Review] Proximal Policy Optimization Algorithms (PPO)

Introduction 강화학습에서 정책 경사(policy gradient) 방법은 높은 표현력과 범용성을 갖추고 있으나, 샘플 효율성이 낮고 학습이 불안정하다는 한계가 있다. Trust Region Poli...

Paper Review #paper-review #reinforcement-learning #policy-gradient

5 min

Jun 01

[Project] EQT-KJ 다차원 손익 자동화 - SQL + Python + Airflow 파이프라인

프로젝트 개요 10개 법인의 ERP 기초 데이터로부터 다차원 손익계산서(P&L)를 자동 산출하는 데이터 파이프라인이다. 반입처/판매처/제품군별 원가 배부, 수율 산출, GP 산정까지 9단계 SQL 쿼리...

Project #python #sql #airflow

12 min

Jan 04

[Paper Review] Integrating Random Effects in Deep Neural Networks

Introduction 계층적 데이터셋(hierarchical datasets)에서는 데이터 포인트가 그룹으로 묶인다 (예: 학교별 학생, 병원별 환자). 이러한 데이터에서 그룹별 변동성(group-speci...

Paper Review #paper-review #deep-learning #statistics

3 min

1
2
3
4
...
6
3 / 6