"Fill in the Middle (FIM)"이라는 pretraining idea에서 출발한 연구 Related Work FIM 문장을 세부분으로 나눈다: prefix, middle, suffix suffix, prefix, middle의 배치로 하고, middle을 예측하도록 학습한다. 하지만 이 방법은 문제점이 몇가지 있다. suffix, prefix의 context 연결이 자연스럽지 않은 것 LM 생성은 일반적으로 최근 생성한 몇가지 토큰에 대해 바이어스 되는 경향이 있음 문장은 prefix, middle, suffix를 무작위적으로 스플릿하는데, 그렇기 때문에 문장 전체를 못봄 (이건 약간 동의하기 힘들다) Bidirectional Language Modeling과 MIM의 차이 제안 방법 "M..