[MPNet: Masked and Permuted Pre-training for Language Understanding]
MLM(e.g. BERT)
PLM(e.g. XLNet)
MLM의 한계는 해결했으나, permuted sequence의 full sentence에 대한 정보가 있지는 않음.
e.g. $x = [x_1, x_2, x_3, x_4] ,\ z= [3,2,1,4]$ → $[x_3, x_2, x_1, x_4]$
→ $x_1$ 은 $x_4$ 와의 관계를 파악할 수 없음
MPNet = MLM(BERT) + PLM (XLNet)
MLM in BERT
Given Sentence : $x= [x_1, ..., x_n]$
$\kappa$ : A set of masked poisition
A set of masked tokens : $x_{\kappa}$