ModelreleaseWetenschappelijke doorbraakKritieke doorbraakOpenAIPublicatie InstructGPT27 Januari 2022SamenvattingOpenAI publiceert InstructGPT - een model dat met reinforcement learning from human feedback (RLHF) is getraind om instructies beter te volgen.DelenOpslaan