본문으로 이동

RLHF 편집하기

172.18.0.1 (토론)님의 2024년 12월 9일 (월) 07:14 판 (새 문서: Cypher 작업의 단계는 다음과 같습니다. - 제안/시작 프롬프트 사용 - 모델 응답 평가 - 선호도 순위 부여 - 응답을 다시 작성 작업 개요 - 이것은 단일 턴 프로젝트입니다. =프롬프트= 1단계 : 프롬프트 작성 작업 오른쪽에 프롬프트 카테고리가 제공됩니다. 이 프롬프트 카테고리를 기반으로 프롬프트를 생성하세요. 목표는 최소한 하나의 모델 실패를 생성하는...)
(차이) ← 이전 판 | 최신판 (차이) | 다음 판 → (차이)
경고: 이 문서의 오래된 판을 편집하고 있습니다. 이것을 게시하면, 이 판 이후로 바뀐 모든 편집이 사라집니다.
경고: 로그인하지 않았습니다. 편집을 하면 IP 주소가 공개되게 됩니다. 로그인하거나 계정을 생성하면 편집자가 사용자 이름으로 기록되고, 다른 장점도 있습니다.
lse에서의 모든 기여는 다른 기여자가 편집, 수정, 삭제할 수 있다는 점을 유의해 주세요. 만약 여기에 동의하지 않는다면, 문서를 저장하지 말아 주세요.
또한, 직접 작성했거나 퍼블릭 도메인과 같은 자유 문서에서 가져왔다는 것을 보증해야 합니다(자세한 사항은 Lse:저작권 문서를 보세요). 저작권이 있는 내용을 허가 없이 저장하지 마세요!
취소 편집 도움말 (새 창에서 열림)