본문으로 이동
주 메뉴
주 메뉴
사이드바로 이동
숨기기
둘러보기
대문
최근 바뀜
임의의 문서로
미디어위키 도움말
특수 문서 목록
lse
검색
검색
보이기
계정 만들기
로그인
개인 도구
계정 만들기
로그인
로그아웃한 편집자를 위한 문서
더 알아보기
기여
토론
RLHF
편집하기 (부분)
문서
토론
한국어
읽기
편집
원본 편집
역사 보기
도구
도구
사이드바로 이동
숨기기
동작
읽기
편집
원본 편집
역사 보기
일반
여기를 가리키는 문서
가리키는 글의 최근 바뀜
문서 정보
보이기
사이드바로 이동
숨기기
경고:
로그인하지 않았습니다. 편집을 하면 IP 주소가 공개되게 됩니다.
로그인
하거나
계정을 생성하면
편집자가 사용자 이름으로 기록되고, 다른 장점도 있습니다.
스팸 방지 검사입니다. 이것을 입력하지
마세요
!
==다양성, Verbvosity== 다변 이 차원에서는 명확하고 직접적이며 간결한 방식으로 충분한 정보를 제공하여 모델이 사용자의 요구를 충족하는지 여부를 평가합니다. 사용자는 바쁘거나 몰두할 수 있으므로 사용자 참여를 유지하는 데 필수적입니다. Verbosity 차원은 모델이 이러한 요구 사항을 충족하는 응답을 제공하는지 여부를 평가하여 응답이 관련 정보를 얼마나 효과적으로 제공하는지를 측정하여 명확하고 간결한 방식으로 필요한 만큼만 제공합니다. 자세한 내용을 평가할 때 고려해야 할 주요 사항: * 관련성 - 응답에는 프롬프트와 관련된 정보만 포함되어야 하며, 주제에서 벗어나지 않고 사용자의 요청을 직접적으로 다루어야 합니다. 좋은 예: "비밀번호 재설정 단계"를 묻는 경우 필요한 단계만 응답에 포함됩니다. 나쁜 예: “비밀번호를 잊어버린 이유”와 같이 관련 없는 세부 정보가 포함된 응답은 간결하지 않습니다. * 답변 속도 - 응답은 사용자에게 필요한 것을 신속하게 제공해야 합니다(이상적으로 처음 1-2 문장에서). 이렇게 하면 사용자는 답변의 개요를 미리 확인한 후 다음 글머리 기호 중 무엇을 결정할 수 있습니다. 또는 집중할 영역을 집중적으로 살펴보세요. 좋은 예: 여권을 얻기 위한 주요 단계는 가장 가까운 영사관을 식별하고, 신청서를 준비하고, 사진을 찍고, 처리를 위해 여행하기 최소 60일 전에 사진을 보내는 것입니다. 가장 가까운 영사관 식별: … 지원서 준비: … … 좋습니다 예: 여권을 갱신하기 위해 고려해야 할 5가지 사항은 다음과 같습니다. 나쁜 예: 물론이죠. 여권을 갱신할 수 있도록 기꺼이 도와드리겠습니다. 다음 사항에 대해 생각해 보세요. 반복 - 간결한 응답은 동일한 정보를 반복하거나 프롬프트를 불필요하게 다르게 표현하는 것을 방지합니다. 좋은 예: 응답은 질문의 일부를 반복하거나 이미 제공된 정보를 요약하지 않고 직접 답변합니다. 나쁜 예: 응답이 질문을 다시 표현하거나("비밀번호를 재설정하려면 다음을 수행해야 합니다.") 단계를 반복합니다. * 초점: 집중된 응답은 관련 없는 일화, 과도한 전문 용어, 불필요한 배경 정보, 보충어 또는 요청된 핵심 정보를 방해할 수 있는 반복을 피해야 합니다. 좋은 예: 응답이 명확하게 구성되어 사용자가 답변에 대한 전체 개요를 매우 빠르게 얻을 수 있습니다. 예: "전기 자동차를 구매할 때 고려해야 할 주요 사항은 주행 거리, 비용, 차량 충전에 필요한 인프라 등입니다. 편안함, 핸들링, 좌석 및 저장 용량과 같은 표준 고려 사항은 다음 구조를 따라야 합니다. 나쁜 예: 응답이 잘 구성되어 있지 않으며 미리 표시되지 않은 여러 추가 항목이 포함되어 있습니다(예: '생각해 볼 또 다른 사항' 또는 '또한 고려할 수 있음'). * 길이 - 응답은 사용자가 제공한 명시적인 길이 요구 사항을 충족해야 합니다. 길이가 지정되지 않은 경우 길이가 과도하거나 부족하지 않고 답변을 직접 포함하도록 적절하게 짧아야 합니다. 좋은 예: 간단한 질문의 경우 답변을 포괄하기에 충분하다면 응답은 한두 문장입니다. 나쁜 예: 응답이 배경 정보로 지나치게 자세하거나 너무 짧거나 전체 답변에 필요한 주요 세부 정보가 누락되었습니다. * 의도 - 응답은 추가 정보나 관련 정보를 추가하지 않고 프롬프트의 기본 의도와 일치해야 합니다. 좋은 예: 프롬프트에서 단계 목록을 묻는 경우 추가 설명 없이 응답에 단계가 나열됩니다. 나쁜 예: 명시적으로 요청되지 않은 제안, 의견 또는 관련 없는 정보를 추가하는 것은 간결성에 어긋납니다. * 장황성 평가 기준 기준 항목: Verbosity (장황성) - 불필요한 반복이나 워딩 없이 문장이 얼마나 효과적으로 정보를 전달하는지. 길이, 관련성, 반복을 확인 1. 너무 장황 (Too Verbose): - 반복 - 응답이 동일한 아이디어나 약간 다른 방식으로 여러 번 반복됨. 문체적 효과를 위한 것이 아님 - 길이 - 응답이 지나치게 장황하거나 프롬프트에서 직접 제시한 단어 제한을 크게 초과함 - 보조 내용 - 제시된 핵심 요점이 완전히 무관함 - 유용성 - 무관한 정보가 있음에도 프롬프트의 핵심 요구사항은 충족됨 2. 적절함 (Just Right): - 반복 - 특정 핵심 포인트를 강조하기 위한 문체적 장치가 아닌 한, 불필요한 정보 반복이 없음 - 길이 - 프롬프트에 답하기 위해 필요한 길이에 맞음 - 보조 내용 - 보조 정보와 증거가 핵심 주장이나 논지와 관련됨 - 유용성 - 각 단락과 문장이 응답의 주장이나 맥락에 직접적으로 가치를 더함 3. 너무 짧음 (Too Short): - 반복 - 응답이 아이디어를 전달하지 못하고 너무 단순함 - 길이 - 응답이 매우 짧아서 평가하기에 충분히 상세하지 않음 - 보조 내용 - 응답의 핵심 주장을 논리적으로 뒷받침하는 보조 정보가 없음 - 유용성 - 응답이 예상보다 짧아서 프롬프트와 직접 관련된 정보가 충분하지 않음
요약:
lse에서의 모든 기여는 다른 기여자가 편집, 수정, 삭제할 수 있다는 점을 유의해 주세요. 만약 여기에 동의하지 않는다면, 문서를 저장하지 말아 주세요.
또한, 직접 작성했거나 퍼블릭 도메인과 같은 자유 문서에서 가져왔다는 것을 보증해야 합니다(자세한 사항은
Lse:저작권
문서를 보세요).
저작권이 있는 내용을 허가 없이 저장하지 마세요!
취소
편집 도움말
(새 창에서 열림)
검색
검색
RLHF
편집하기 (부분)
새 주제