VisualSiteDiary: A detector-free Vision-Language Transformer model for captioning photologs for daily construction reporting and image retrievals
Autor(en): |
Yoonhwa Jung
Ikhyun Cho Shun-Hsiang Hsu Mani Golparvar-Fard |
---|---|
Medium: | Fachartikel |
Sprache(n): | Englisch |
Veröffentlicht in: | Automation in Construction, September 2024, v. 165 |
Seite(n): | 105483 |
DOI: | 10.1016/j.autcon.2024.105483 |
- Über diese
Datenseite - Reference-ID
10786021 - Veröffentlicht am:
20.06.2024 - Geändert am:
20.06.2024