Hugging Face SFT Trainer

대분류

인공지능/데이터

소분류

Hugging Face

유형

Hugging Face

부유형

Trainer

최종 편집 일시

2024/10/27 15:17

생성 일시

2024/10/22 01:29

14 more properties

TRL - Transformer Reinforcement Learning

Trainer vs SFTTrainer

TRL - Transformer Reinforcement Learning

•

Supervised Fine-tuning, (SFT), Reward Modeling, (RM), the Proximal Policy Optimization, (PPO) 까지 제공할 수 있는 Transformer 언어 모델 학습용 라이브러리

Trainer vs SFTTrainer

LLM 파인튜닝을 위해 TRL 라이브러리의 Trainer 클래스 또는 SFTTrainer 클래스를 많이 이용하는 추세입니다. 두 가지 클래스의 장점 및 차이점은 다음과 같다.