Multimodal Learning with Vision and Language


Erdem A., Erdem E.

9th International Conference on Image Processing Theory, Tools and Applications (IPTA), İstanbul, Türkiye, 6 - 09 Kasım 2019 identifier identifier

  • Yayın Türü: Bildiri / Tam Metin Bildiri
  • Cilt numarası:
  • Doi Numarası: 10.1145/3343031.3350935
  • Basıldığı Şehir: İstanbul
  • Basıldığı Ülke: Türkiye
  • Hacettepe Üniversitesi Adresli: Evet

Özet

This tutorial presents the recent advances in multi-modal learning for integrated vision and language problems and gives the necessary background.