GPT-2

image.png

ROUGE F1 metrics on CNN and Daily Mail dataset

T5에서도 CNNDM 사용

ROUGE

정답 문서와 생성 문서를 비교하여, 겹치는 부분에 대한 recall 점수를 구하는 것

ROUGE-N

진짜 말 그대로 n-gram이 몇개나 겹치는지 확인

겹치는 n-gram 개수 / 정답 문서의 n-gram 개수

ROUGE-L

L : Longest Common Subsequence


GPT 설명

ROUGE-L의 설득력

ROUGE-L이 여전히 널리 사용되는 이유는: