/ ML

Self-Supervised learning 에 대한 고찰

Self- supervised learning에 대한 개념을 정립하고 싶어 이 포스팅을 하게되었다.

Self-supervised learning

  • 일반적으로 unlabelled data로 representation을 학습하는 경우를 말함.

왜 unlabelled data를 학습하나?

  • represestation을 적극적으로 학습하는 게 downstream task에 적용하는 데 도움이 됨
  • 실제 labelled data는 거의 없으니까.. 이렇게 학습하는 게 도움되지

어떤 유형들이 있나?

  • Contrastive learning : 문장 여러개를 학습시켰다면 , 문장 간 관계를 학습
  • Self-prediction : 문장내에 앞부분이 주어졌을때 뒷부분은 예측하는 모델
  • Autoregressive modelling : 주어진 time series data의 앞부분들을 고려하여 다음 t 시점의 data를 예측

Reference

  • https://papers.nips.cc/paper/2014/file/17e23e50bedc63b4095e3d8204ce063b-Paper.pdf