Search

Hugging Face SFT Trainer

대분류
인공지능/데이터
소분류
Hugging Face
유형
Hugging Face
부유형
Trainer
최종 편집 일시
2024/10/27 15:17
생성 일시
2024/10/22 01:29
14 more properties

TRL - Transformer Reinforcement Learning

Supervised Fine-tuning, (SFT)Reward Modeling, (RM)the Proximal Policy Optimization, (PPO) 까지 제공할 수 있는 Transformer 언어 모델 학습용 라이브러리

Trainer vs SFTTrainer

LLM 파인튜닝을 위해 TRL 라이브러리의 Trainer 클래스 또는 SFTTrainer 클래스를 많이 이용하는 추세입니다. 두 가지 클래스의 장점 및 차이점은 다음과 같다.