VisualSiteDiary: A detector-free Vision-Language Transformer model for captioning photologs for daily construction reporting and image retrievals
Auteur(s): |
Yoonhwa Jung
Ikhyun Cho Shun-Hsiang Hsu Mani Golparvar-Fard |
---|---|
Médium: | article de revue |
Langue(s): | anglais |
Publié dans: | Automation in Construction, septembre 2024, v. 165 |
Page(s): | 105483 |
DOI: | 10.1016/j.autcon.2024.105483 |
- Informations
sur cette fiche - Reference-ID
10786021 - Publié(e) le:
20.06.2024 - Modifié(e) le:
20.06.2024