VisualSiteDiary: A detector-free Vision-Language Transformer model for captioning photologs for daily construction reporting and image retrievals

Auteur(s):	Yoonhwa Jung Ikhyun Cho Shun-Hsiang Hsu Mani Golparvar-Fard
Médium:	article de revue
Langue(s):	anglais
Publié dans:	Automation in Construction, septembre 2024, v. 165
Page(s):	105483
DOI:	10.1016/j.autcon.2024.105483

Structurae ne peut pas vous offrir cette publication en texte intégral pour l'instant. Le texte intégral est accessible chez l'éditeur. DOI: 10.1016/j.autcon.2024.105483.

Publicité

Structurae coopère avec

Publicité