VisualSiteDiary: A detector-free Vision-Language Transformer model for captioning photologs for daily construction reporting and image retrievals

Autor(en):	Yoonhwa Jung Ikhyun Cho Shun-Hsiang Hsu Mani Golparvar-Fard
Medium:	Fachartikel
Sprache(n):	Englisch
Veröffentlicht in:	Automation in Construction, September 2024, v. 165
Seite(n):	105483
DOI:	10.1016/j.autcon.2024.105483

Structurae kann Ihnen derzeit diese Veröffentlichung nicht im Volltext zur Verfügung stellen. Der Volltext ist beim Verlag erhältlich über die DOI: 10.1016/j.autcon.2024.105483.

Anzeige

Structurae kooperiert mit

Anzeige