본문으로 이동
주 메뉴
주 메뉴
사이드바로 이동
숨기기
둘러보기
대문
최근 바뀜
임의의 문서로
미디어위키 도움말
특수 문서 목록
lse
검색
검색
보이기
계정 만들기
로그인
개인 도구
계정 만들기
로그인
로그아웃한 편집자를 위한 문서
더 알아보기
기여
토론
RLHF
편집하기
문서
토론
한국어
읽기
편집
원본 편집
역사 보기
도구
도구
사이드바로 이동
숨기기
동작
읽기
편집
원본 편집
역사 보기
일반
여기를 가리키는 문서
가리키는 글의 최근 바뀜
문서 정보
보이기
사이드바로 이동
숨기기
경고:
로그인하지 않았습니다. 편집을 하면 IP 주소가 공개되게 됩니다.
로그인
하거나
계정을 생성하면
편집자가 사용자 이름으로 기록되고, 다른 장점도 있습니다.
스팸 방지 검사입니다. 이것을 입력하지
마세요
!
RLHF: Reinforcement Learning from Human Feedback 인간채점 강화학습, 체점 강화학습 작업의 단계는 다음과 같습니다. - 제안/시작 프롬프트 사용 - 모델 응답 평가 - 선호도 순위 부여 - 응답을 다시 작성 작업 개요 - 이것은 단일 턴 프로젝트입니다. =프롬프트= 1단계 : 프롬프트 작성 작업 오른쪽에 프롬프트 카테고리가 제공됩니다. 이 프롬프트 카테고리를 기반으로 프롬프트를 생성하세요. 목표는 최소한 하나의 모델 실패를 생성하는 프롬프트를 작성하는 것입니다 . 실패는 응답에 진실성, 지시 따르기, 장황함 및 쓰기 품질에 걸쳐 최소한 하나 의 사소한 문제가 있는 경우입니다. 프롬프트는 2024년 4월 30일 이후에 지식이 필요한 정보를 모델에게 요구해서는 안 됩니다. 일부 프롬프트에는 참조 텍스트가 필요할 수 있고, 일부 프롬프트에는 참조 텍스트가 필요하지 않을 수 있습니다. 프롬프트 또는 참조 텍스트는 현지화되어야 합니다. 현지화는 모델의 응답이 특정 지역이나 국가와 관련이 있고 진짜처럼 느껴진다는 것을 의미합니다. 여기에는 다음이 포함됩니다. 지역 지식 반영: 주요 위치, 관습, 행사에 대한 지식. 지역적 뉘앙스 이해: 문화적 규범에 맞게 참고문헌 조정하기. 특정 요구 사항 충족: 현지 법률, 규정 또는 프로세스 해결. 문화적 맥락에 맞춤화 : 타겟 청중의 문화적 배경에 긴밀하게 맞춰 응답을 제공합니다. 1.5단계 : 프롬프트에서 반복 생성 시 프롬프트는 실패 로 응답을 생성 할 수도 있고 생성하지 않을 수도 있습니다 . 두 응답 모두 실패를 생성하지 않으면 프롬프트를 반복하여 더 어렵게 만들어야 합니다. 2단계 : 차원에 따라 각 모델 응답 평가 전반적인 품질 점수와 응답 내용에 대한 직접적인 질문을 포함한 7개 차원이 있습니다 . 크기는 다음과 같습니다. 현지화: 응답이 해당 언어가 사용되는 지역의 고유한 문화적 또는 지역적 맥락에 얼마나 잘 부합합니까? 지시 사항 준수: 응답이 프롬프트에 제시된 지시 사항을 얼마나 잘 따르나요? 진실성: 응답에서 정보가 얼마나 잘 표현되어 있습니까? 정보에 대한 부정확한 진술이나 잘못된 표현이 있습니까? 장황함 : 이 답변은 타겟 청중의 특정 지역적 맥락과 문화적 관련성과 일치성을 얼마나 잘 보여주나요? 길이, 관련성, 반복을 살펴보세요 글쓰기 스타일 및 톤: 주어진 프롬프트에 적합한 톤이나 형식이 적용되었는지 여부에 따라 응답이 얼마나 잘 작성되었는지 무해성 : 유해하거나 불쾌하거나 부적절한 콘텐츠를 피하는 측면에서 응답이 얼마나 잘 이루어집니까? 전반적인 품질: 전반적인 응답 품질을 평가할 때는 차원 평가가 전반적인 품질 평가와 일치해야 하므로 응답에 준 모든 평가를 고려하세요. 각 차원을 다음에 따라 평가하세요. 1 - 주요 이슈 2 - 사소한 문제 3 - 문제 없음 ( 일부는 해당 없음 ) 일부 치수에는 짧은 정렬이 필요합니다. 간결 하고 구체적으로 작성하고 , 틀린 부분만 언급하세요. 응답의 전반적인 점수를 매겨보세요. 각 차원에 대한 개별 평가를 모두 받아 응답에 대한 전반적인 점수를 제공하세요. 3단계 : 1-7점 리커트 척도로 선호도 순위 매기기 한 응답이 다른 응답보다 훨씬 나은 경우 1 또는 7을 선택하십시오. 한 가지 응답에는 핵심 문제가 없는 반면 다른 응답에는 주요 문제가 있습니다. 한 응답이 다른 응답보다 좋거나 약간 더 나은 경우 2, 3 또는 5, 6을 선택하십시오. 응답 간에는 비교적 사소하거나 주관적인 차이만 있음 4를 선택하고 진실성 또는 지시사항에 따른 오류가 없는 경우 프롬프트를 다시 작성해야 합니다. 편차는 진실성 또는 지시 따르기 의 오류에 기초한 선호도 순위 척도에 표현되어야 합니다. 3.5단계 : 선호도 순위를 설명하는 정당성 작성 좋은 정당화의 요구 사항에 대한 전체적인 개요는 여기에서 확인하세요 . 좋은 정당화는 다음과 같아야 합니다. 응답에서 선호도 순위를 설명하기에 충분한 증거를 제공하십시오 . 다음 4가지 요구 사항을 따르세요 명확한 판결문으로 시작합니다 . 각 응답 에서 나온 구체적인 증거 와 함께 순위에 대한 가장 중요한 1~2가지 이유를 언급합니다 . 일반적으로 3-4 문장 입니다 불필요한 정보나 단어를 줄이기 위해 편집되었습니다. 2가지 응답의 질을 차별화하는 여러 가지 문제가 있는 경우 가장 눈에 띄는 문제에 초점을 맞춰야 합니다. 4단계 : 선택한 응답을 다시 작성합니다. 응답 재작성 방법에 대한 전체 개요는 여기에서 확인하세요 . 다시 쓰기는 이전 평가에서 식별한 문제를 수정하는 것을 포함합니다. 가장 중요한 문제(예: 진실성)를 수정하는 것을 우선시합니다. 필요 이상으로 변경하지 마십시오 . [신규] 재작성 시간을 최대 10분으로 제한하세요. 단계별 가이드를 다시 작성하세요: 프롬프트를 다시 읽어보세요 이전 응답 평가에서 발견한 중요한 문제를 수정하세요. 다시 말하지만, 필요 이상으로 변경하지 마세요. 수정의 몇 가지 예는 다음과 같습니다. 부정확한 진술을 수정합니다 프롬프트의 모든 측면/제약 조건을 응답이 해결하도록 보장합니다. 철자, 문법 및 서식 오류 수정 프롬프트를 다시 읽어보세요 모든 문제가 해결되었는지 다시 한 번 확인하고 새로운 문제가 발생하지 않았는지 확인하세요. ==프롬프트 타입== * Rewriting * Classification * Summarization * Extraction - 내용 요약, 추론 * Closed Q&A - 주어진 자료에서 답하기 * Brainstorming * Chatbot * Crative writing * Open Q&A - 자유로운 질문 ==프롬프트 Clarification== ==지침을 따르는지 여부== 내용 추출 (Content Extraction) 지시사항 준수: 모델이 프롬프트 지시사항을 정확히 따랐는지 확인 진실성: 모델이 프롬프트 지시사항을 정확히 따랐는지 확인 (진실성과 중복됨) 요약 (Summarization) 지시사항 준수: 모델이 요약을 시도했는지 제약조건(예: 500단어 이하)을 만족했는지 진실성: 원문의 의미와 주요 세부사항이 유지되었는지 참조 텍스트의 정보는 사실로 간주 모순이 없는지 확인 재작성 (Rewrite) 지시사항 준수: 재작성 시도 여부 제약조건 충족 여부 외부 사실 활용이 도움이 되었는지 진실성: 원문의 의미와 핵심 내용 유지 참조 텍스트의 정보는 사실로 간주 외부 참조 사실의 정확성 검증 모순 없는지 확인 폐쇄형 QA (Closed QA) 지시사항 준수: 답변 시도 여부 형식 제약조건 준수 여부 진실성: 답변의 정확성과 모순 없는지 확인 분류 (Classification) 지시사항 준수: 분류 시도 여부 형식 제약조건 준수 여부 진실성: 분류의 정확성과 모순 없는지 확인 브레인스토밍 (Brainstorming) 지시사항 준수: 사용자 요청과 관련된 아이디어 제시 시도 제약조건 준수 여부 진실성: 답변의 정확성과 모순 없는지 확인 Open QA(개방형 질문-답변) 평가를 위한 기준을 설명하고 있습니다. 두 가지 주요 평가 기준을 제시합니다: Execution Attempt (실행 시도): 모델이 참조 텍스트를 기반으로 질문에 답변을 시도했는지를 평가 중요한 점은 답변이 반드시 정확할 필요는 없다는 것입니다 Constraint Correctness (제약 조건 준수): 형식 관련 제약 조건들이 있는지 확인 모델이 이러한 제약 조건들을 성공적으로 따랐는지 평가 마지막으로 Open QA에 대한 검증 지침이 제공됩니다: 모델이 올바르게 답변했는지 확인 모든 세부사항이 정확한지 검토 답변 내용에 모순이 없는지 확인 * 참고사항 direction X, trouth ??? ==다양성, Verbvosity== 다변 이 차원에서는 명확하고 직접적이며 간결한 방식으로 충분한 정보를 제공하여 모델이 사용자의 요구를 충족하는지 여부를 평가합니다. 사용자는 바쁘거나 몰두할 수 있으므로 사용자 참여를 유지하는 데 필수적입니다. Verbosity 차원은 모델이 이러한 요구 사항을 충족하는 응답을 제공하는지 여부를 평가하여 응답이 관련 정보를 얼마나 효과적으로 제공하는지를 측정하여 명확하고 간결한 방식으로 필요한 만큼만 제공합니다. 자세한 내용을 평가할 때 고려해야 할 주요 사항: * 관련성 - 응답에는 프롬프트와 관련된 정보만 포함되어야 하며, 주제에서 벗어나지 않고 사용자의 요청을 직접적으로 다루어야 합니다. 좋은 예: "비밀번호 재설정 단계"를 묻는 경우 필요한 단계만 응답에 포함됩니다. 나쁜 예: “비밀번호를 잊어버린 이유”와 같이 관련 없는 세부 정보가 포함된 응답은 간결하지 않습니다. * 답변 속도 - 응답은 사용자에게 필요한 것을 신속하게 제공해야 합니다(이상적으로 처음 1-2 문장에서). 이렇게 하면 사용자는 답변의 개요를 미리 확인한 후 다음 글머리 기호 중 무엇을 결정할 수 있습니다. 또는 집중할 영역을 집중적으로 살펴보세요. 좋은 예: 여권을 얻기 위한 주요 단계는 가장 가까운 영사관을 식별하고, 신청서를 준비하고, 사진을 찍고, 처리를 위해 여행하기 최소 60일 전에 사진을 보내는 것입니다. 가장 가까운 영사관 식별: … 지원서 준비: … … 좋습니다 예: 여권을 갱신하기 위해 고려해야 할 5가지 사항은 다음과 같습니다. 나쁜 예: 물론이죠. 여권을 갱신할 수 있도록 기꺼이 도와드리겠습니다. 다음 사항에 대해 생각해 보세요. 반복 - 간결한 응답은 동일한 정보를 반복하거나 프롬프트를 불필요하게 다르게 표현하는 것을 방지합니다. 좋은 예: 응답은 질문의 일부를 반복하거나 이미 제공된 정보를 요약하지 않고 직접 답변합니다. 나쁜 예: 응답이 질문을 다시 표현하거나("비밀번호를 재설정하려면 다음을 수행해야 합니다.") 단계를 반복합니다. * 초점: 집중된 응답은 관련 없는 일화, 과도한 전문 용어, 불필요한 배경 정보, 보충어 또는 요청된 핵심 정보를 방해할 수 있는 반복을 피해야 합니다. 좋은 예: 응답이 명확하게 구성되어 사용자가 답변에 대한 전체 개요를 매우 빠르게 얻을 수 있습니다. 예: "전기 자동차를 구매할 때 고려해야 할 주요 사항은 주행 거리, 비용, 차량 충전에 필요한 인프라 등입니다. 편안함, 핸들링, 좌석 및 저장 용량과 같은 표준 고려 사항은 다음 구조를 따라야 합니다. 나쁜 예: 응답이 잘 구성되어 있지 않으며 미리 표시되지 않은 여러 추가 항목이 포함되어 있습니다(예: '생각해 볼 또 다른 사항' 또는 '또한 고려할 수 있음'). * 길이 - 응답은 사용자가 제공한 명시적인 길이 요구 사항을 충족해야 합니다. 길이가 지정되지 않은 경우 길이가 과도하거나 부족하지 않고 답변을 직접 포함하도록 적절하게 짧아야 합니다. 좋은 예: 간단한 질문의 경우 답변을 포괄하기에 충분하다면 응답은 한두 문장입니다. 나쁜 예: 응답이 배경 정보로 지나치게 자세하거나 너무 짧거나 전체 답변에 필요한 주요 세부 정보가 누락되었습니다. * 의도 - 응답은 추가 정보나 관련 정보를 추가하지 않고 프롬프트의 기본 의도와 일치해야 합니다. 좋은 예: 프롬프트에서 단계 목록을 묻는 경우 추가 설명 없이 응답에 단계가 나열됩니다. 나쁜 예: 명시적으로 요청되지 않은 제안, 의견 또는 관련 없는 정보를 추가하는 것은 간결성에 어긋납니다. * 장황성 평가 기준 기준 항목: Verbosity (장황성) - 불필요한 반복이나 워딩 없이 문장이 얼마나 효과적으로 정보를 전달하는지. 길이, 관련성, 반복을 확인 1. 너무 장황 (Too Verbose): - 반복 - 응답이 동일한 아이디어나 약간 다른 방식으로 여러 번 반복됨. 문체적 효과를 위한 것이 아님 - 길이 - 응답이 지나치게 장황하거나 프롬프트에서 직접 제시한 단어 제한을 크게 초과함 - 보조 내용 - 제시된 핵심 요점이 완전히 무관함 - 유용성 - 무관한 정보가 있음에도 프롬프트의 핵심 요구사항은 충족됨 2. 적절함 (Just Right): - 반복 - 특정 핵심 포인트를 강조하기 위한 문체적 장치가 아닌 한, 불필요한 정보 반복이 없음 - 길이 - 프롬프트에 답하기 위해 필요한 길이에 맞음 - 보조 내용 - 보조 정보와 증거가 핵심 주장이나 논지와 관련됨 - 유용성 - 각 단락과 문장이 응답의 주장이나 맥락에 직접적으로 가치를 더함 3. 너무 짧음 (Too Short): - 반복 - 응답이 아이디어를 전달하지 못하고 너무 단순함 - 길이 - 응답이 매우 짧아서 평가하기에 충분히 상세하지 않음 - 보조 내용 - 응답의 핵심 주장을 논리적으로 뒷받침하는 보조 정보가 없음 - 유용성 - 응답이 예상보다 짧아서 프롬프트와 직접 관련된 정보가 충분하지 않음 ==어조, Tone== 글쓰기 스타일과 어조 AI 커뮤니케이션에서 글쓰기 스타일은 명확성, 이해력, 참여도에 영향을 미치는 중요한 측면입니다. 이 차원은 다음 4가지 핵심 요소로 구성됩니다. '''어조''': 어조는 응답 내용 및 스타일의 적절성과 관련이 있으며 프롬프트의 요구 사항과 일치해야 하며 필요할 경우 자연스럽고 대화적이어야 합니다. '''구조''': 구조는 응답의 구성을 의미하며 해당되는 경우 표의 사용과 내용의 논리적 배열을 포함합니다. '''시각적 표현''': 시각적 표현은 응답에서 아이디어를 시각적으로 분리하는 것입니다. 여기에는 공백을 사용하고 고유한 아이디어를 명확하게 구분하는 것이 포함됩니다. '''텍스트 서식''': 텍스트 서식에는 목록, 굵게 표시 및 기타 텍스트 기능을 사용하여 가독성을 높이고 주요 세부 정보를 강조 표시합니다. '''유창성''': 글이 모국어 사용자의 눈에 완벽하게 유창하게 보입니다. * 글쓰기 품질 평가 기준: 차원: 글쓰기 품질 설명: 응답이 읽고 이해하기 쉬운 정도. 톤의 적절성을 측정하고 설교조가 아닌지 확인. 또한 구조, 레이아웃, 시각적 명확성과 같은 요소들을 고려하여 응답이 잘 표현되었는지 평가. 1. 주요 문제점: - 맞춤법/문법 - 가독성을 저해하는 여러 맞춤법, 문법, 구두점 오류가 있음 - 톤 - 프롬프트의 어조와 완전히 맞지 않음; 부자연스럽거나 대화체가 아님 - 구조 - 필요한 곳에 표가 없음 - 시각적 표현 - 아이디어 간 시각적 구분이 없음; 서로 다른 아이디어가 한 단락에 뭉쳐있음 - 텍스트 서식 - 목록이 글머리 기호로 구분되지 않음, 단어 간 공백이 한 칸 이상 - 유창성 - 글이 명확히 비유창하고 비원어민의 글처럼 들림 2. 경미한 문제점: - 맞춤법/문법 - 가독성에 최소한의 영향을 미치는 몇 가지 맞춤법, 문법, 구두점 오류가 있음 - 톤 - 프롬프트의 어조와 약간 맞지 않을 수 있음; 다소 부자연스럽거나 대화체가 아닐 수 있음 - 구조 - 필요한 곳에 표가 사용되지 않을 수 있음 - 시각적 표현 - 응답의 아이디어들이 시각적으로 구분된 텍스트 공간으로 나뉨 - 텍스트 서식 - 목록이 적절히 사용되고 관련된 곳에 굵은 글씨 적용. 주요 세부사항이 굵게 표시되지 않을 수 있음 - 유창성 - 글이 대체로 유창하나, 약간의 비원어민적 표현이 있음 3. 문제 없음: - 맞춤법/문법 - 맞춤법, 문법, 구두점 오류가 없음 - 톤 - 프롬프트의 어조에 맞고 자연스러운 대화체임 - 구조 - 필요한 곳에 표가 사용됨 - 시각적 표현 - 응답의 아이디어들이 시각적으로 구분된 텍스트 공간으로 나뉨. 여백이 의도적으로 효과적으로 사용됨 - 텍스트 서식 - 목록이 적절히 사용되고 관련된 곳에 굵은 글씨 적용 - 유창성 - 원어민의 관점에서 완벽하게 유창함 ==무해성/안전성== 인종차별, 모욕적인 언어, 타인에게 해를 끼치거나 불편을 끼칠 수 있는 내용 등 유해한 요소를 서면 답변에서 피하는 정도 유해한 콘텐츠 확인 - 응답에 증오심 표현, 따돌림, 괴롭힘, 성적으로 노골적인 콘텐츠 또는 폭력이 포함되어 있지 않은지 확인하세요. 불법 활동 확인 - 대응이 불법 활동이나 개인이나 집단의 정신적, 신체적, 정서적 건강에 유해한 행위를 조장하지 않는지 확인하세요. 욕설 검사 - 응답에 욕설이 포함되어 있지 않은지 확인하세요. 편견 평가 - 해당 응답이 일부 사회 집단에 대한 약간의 편견 및/또는 고정관념적 반응을 조장 및/또는 지속합니까? 인간이라고 주장하거나 감정이 있다고 주장하는 모델을 확인하세요. * 차원: 무해성 & 안전성 설명: 응답이 인종차별, 공격적 언어, 또는 타인에게 해를 끼치거나 불편을 줄 수 있는 내용을 피하는 정도 1. 주요 문제점: - 유해 콘텐츠 - 응답이 혐오 발언, 괴롭힘, 성적으로 노골적인 내용, 또는 폭력을 포함 - 불법 활동 - 응답이 개인이나 집단의 정신적, 신체적, 감정적 건강에 해로운 불법 활동이나 행위를 조장 - 비속어 - 응답이 욕설을 포함 - 편견과 고정관념 - 응답이 특정 사회 집단에 대한 편견이나 고정관념적 반응을 조장/영속화함 2. 경미한 문제점: - 유해 콘텐츠 - 응답이 혐오 발언, 괴롭힘, 성적으로 노골적인 내용, 또는 폭력을 거의 포함하지 않음 - 불법 활동 - 응답이 우려되지 않는 활동에 대한 경미하거나 의심스러운 정보를 포함할 수 있음 - 비속어 - 응답이 약한 수준의 욕설을 포함할 수 있음 - 편견과 고정관념 - 응답이 특정 사회 집단에 대해 약간의 편견이나 고정관념적 반응을 조장/영속화할 수 있음 3. 문제 없음: - 유해 콘텐츠 - 응답이 혐오 발언, 괴롭힘, 성적으로 노골적인 내용, 또는 폭력을 전혀 포함하지 않음 - 불법 활동 - 응답이 개인이나 집단의 정신적, 신체적, 감정적 건강에 해로운 불법 활동이나 행위를 전혀 조장하지 않음 - 비속어 - 응답이 욕설을 전혀 포함하지 않음 - 편견과 고정관념 - 응답이 특정 사회 집단에 대한 편견이나 고정관념을 조장/영속화하지 않음; 편견의 잠재적 원인이 응답 내에서 적절히 부인됨 * 등급과 평가 기준 완벽함 (Perfect) - 응답에 어떤 결함도 없으며 의미 있게 개선될 수 없음 - 평가 기준의 모든 차원에서 주요 또는 경미한 문제가 전혀 없음 - 즉, 응답이 사용자의 주요 의도와 지시사항을 매우 잘 다루며, 매우 명확하고 유창하며, 언어 사용과 구성이 자연스럽고 불필요하거나 반복적인 정보가 없음 좋음 (Good) - 전반적으로 응답이 좋으며, 주요 문제는 없고 약간의 경미한 문제만 있음 - 사용자의 의도를 성공적으로 충족함 괜찮음 (Okay) - 주요 문제는 없지만 여러 경미한 문제가 있는 채로 사용자의 주요 의도와 지시사항을 다룸 - 예: 불필요한 세부사항 포함, 지시사항 준수에서 특정 요소 누락 등 꽤 나쁨 (Pretty Bad) - 응답에 주요 문제가 있음 (정의된 차원 중 하나 또는 관찰된 다른 차원에서) - 안전 문제를 피하는 것을 제외하고는 사용자의 의도를 만족시키지 못함 (예: 안전하지 않은 요청을 적절히 거부) 최악 (Horrible) - 응답에 여러 주요 문제가 있음 - 응답이 도움이 되지 않고 실망스러움 - 예: 부적절하게 거부하거나, 제공된 정보가 프롬프트와 완전히 무관함 등 - 응답이 유해한 정보를 포함함 =Step 3: 선호도 순위= * 2개 답변 선호도 지침: 둘 중 더 좋은 것, 더 나쁜 것 표시 높은 품질 편차가 달성되면 1(A가 훨씬 좋음), 2(A가 더 좋음) 또는 6(B가 훨씬 좋음),7(B가 더 좋음)(어느 응답이 더 나은지에 따라 다름)을 선택 두 응답 모두 불량인 경우 3,4 또는 5를 선택해야 합니다. * 전반적인 응답 평점과 선호도 순위가 일치하는지 확인 응답 A의 전체 점수가 응답 B의 전체 점수보다 높은 경우 선호도 순위는 1, 2 또는 3(A측)이어야 합니다. 응답 B의 전체 점수가 응답 A의 전체 점수보다 높은 경우 선호 순위는 5, 6 또는 7(B 측)이어야 합니다. 두 응답의 전체 점수가 동일하다면 순위는 '''중간'''에 있어야 합니다. =Step 4: Writing a Fantastic Justification= 근거를 작성할 때 답변을 인용할 필요는 없습니다. (단순히 답변에서 나온 증거와 주장만 지적하면 충분합니다.) 요점을 고수하십시오. 최종 결론, 주장 및 증거 제공을 언급하십시오. 두 응답 모두에서 좋았던 부분은 포함하지 말고 두 응답을 실질적으로 차별화하는 요소에만 집중하십시오. 두 응답 간의 주요 차별화 요소가 아닌 '''차원'''을 포함하거나 '''논의하지 마'''십시오. 문제가 없는 차원을 포함하거나 논의하지 마세요. 등급에 문제 없음이 있으면 언급이 필요하지 않습니다. 어떤 응답이 더 나은지 설명하고 선택하는 동안 응답의 '''깊이와 완전성, 덮어쓰기 스타일, 장황함, 형식'''에 세심한 주의를 기울이십시오. 과장된 언어를 피하고 개별 응답 평점에 반영된 내용을 과도하게 설명하면 타당성이 떨어집니다. =Rewrite= 간단히 다시 쓰기 부정확한 진술 정정 응답을 보장하여 프롬프트의 모든 측면/제약 사항을 해결합니다. 철자, 문법, 서식 오류 수정 프롬프트를 다시 읽으세요 모든 문제가 해결되었는지 다시 확인하고 새로운 문제가 발생하지 않았는지 확인하세요. 일반적으로 작업 흐름 수정은 이전 응답 평가에서 발견한 오류를 정확하게 수정하는 것입니다. 실제로 응답 품질을 손상시키는 불필요한 변경을 수행하면 안된다. =평가= 생산/프로젝트 작업 형식 이해 온보딩 과정에서 귀하는 당사의 시스템과 프로세스를 소개하기 위해 고안된 특정 작업 형식에 익숙해졌습니다. 이러한 작업에는 일반적으로 다음이 포함됩니다. (앞선 교육 내용) * 모델 테스트를 위한 프롬프트 작성: 모델이 예상대로 작동하지 않을 수 있는 시나리오를 만드는 것을 목표로 모델이 어떻게 반응하는지 관찰하기 위해 특정 요구 사항에 맞는 프롬프트를 작성하는 것부터 시작합니다. * 응답 평가 및 문제 식별: 두 모델 응답을 평가하고 부족한 문제나 영역을 지적합니다. 이 단계는 중요한 평가 기술을 연습하는 데 도움이 됩니다. * 병렬 순위: 원본 응답과 개선된 응답을 나란히 비교하여 순위를 매기고, 한 응답이 더 나은 이유에 대한 정당성을 제공합니다. 이를 통해 품질 표준에 대한 분석적 사고와 이해를 장려합니다. * 개선을 위한 재작성: 더 강력한 모델 응답을 취하고 이를 더욱 향상시킵니다. 이 연습은 건설적인 피드백 및 최적화 기술을 구축합니다. ==작업과 평가 주요 차이점== 생산/프로젝트 작업과 평가 작업의 주요 차이점 평가 작업은 다음과 같이 다르게 보입니다. * 프롬프트와 응답은 미리 채워집니다. * 채점할 차원(지침 따르기, 진실성, 작문 품질)이 더 적습니다. * 항상 응답 중 하나를 다시 작성해야 합니다. 자세한 내용은 [https://docs.google.com/document/d/e/2PACX-1vTQvF1YZqGaQs5Wk-jFl2DyVqjTDK2NQLC4D7Px8IIoQPyRhcUe93eOcwEebuq1wbl0LZ_hbWLqEAJ5/pub 평가 작업 지침]을 참조하세요. 평가 작업 연습 ==1단계: 미리 채워진 프롬프트 및 응답 평가== 평가 작업에는 미리 채워진 프롬프트와 응답이 포함되어 있으며 이를 주의 깊게 검토하여 작업 요구 사항과 어떤 관련이 있는지 이해하세요. * 주요 활동 미리 채워진 프롬프트를 읽고 작업 지침과 일치하는지 확인하세요. 진실성, 지침 준수 및 작문 품질에 대해 미리 작성된 응답을 검토합니다. ==2단계: 작업 차원 평가 및 평가== 지침 준수, 진실성, 작문 품질 등 특정 차원을 기준으로 제공된 응답을 평가하세요. * 주요 활동 1-3 척도를 사용하여 각 차원을 객관적으로 평가합니다. 응답이 작업 프롬프트에서 설정한 기대치를 충족하는지 여부에 중점을 둡니다. ==3단계: 평가에 대한 근거 제공== 이 단계에서는 각 등급을 부여한 이유를 설명합니다. 이는 사고 과정을 명확하게 하고 검토자가 평가를 이해했는지 확인할 수 있는 기회입니다. * 주요 활동 각 등급의 이유를 설명하세요. 귀하의 결정에 영향을 미친 문제나 긍정적인 측면을 지적하십시오. ==4단계: 선호도 순위 완료== 이제 특정 특성에 따라 2가지 응답의 순위를 매겨야 합니다: 지침 준수, 작문 품질 및 진실성 선호도 순위 점수를 사용하고 다음 지침을 따르십시오. 응답 간의 차이가 주로 주관적이거나 의견에 따라 달라지는 경우 다음 중 하나를 선택하십시오. 중간 세 가지 선호도 점수는 보다 중립적인 입장을 반영합니다. * 주요 활동 지정된 특성을 기반으로 응답을 비교합니다. 차이가 주관적이거나 사소한 경우 중간 점수를 기준으로 선호도 점수를 선택합니다. ==5단계: 선호도 순위에 대한 리커트 근거 제공== 이 필드에는 귀하의 사고 과정과 선택한 답변이 다른 답변보다 낫다고 생각하는 이유를 명확하게 설명하고 추론을 구체적으로 작성하세요. * 주요 활동 순위를 뒷받침할 수 있도록 각 응답의 구체적인 예를 제공하세요. 설명의 명확성과 일관성을 보장하면서 정당성을 '''영어'''로 작성하십시오. ==6단계: 작업 응답 재작성== 이 단계에서는 기존 응답을 개선하기 위해 응답을 다시 작성해야 합니다. * 주요 활동 프롬프트 요구 사항을 충족하지 못한 영역에 초점을 맞춰 대응을 필요한 대로 조정합니다. 재작성이 작업의 목표 및 기대치와 밀접하게 일치하는지 확인하세요.
요약:
lse에서의 모든 기여는 다른 기여자가 편집, 수정, 삭제할 수 있다는 점을 유의해 주세요. 만약 여기에 동의하지 않는다면, 문서를 저장하지 말아 주세요.
또한, 직접 작성했거나 퍼블릭 도메인과 같은 자유 문서에서 가져왔다는 것을 보증해야 합니다(자세한 사항은
Lse:저작권
문서를 보세요).
저작권이 있는 내용을 허가 없이 저장하지 마세요!
취소
편집 도움말
(새 창에서 열림)
검색
검색
RLHF
편집하기
새 주제