Till sidans topp

Sidansvarig: Webbredaktion
Sidan uppdaterades: 2012-09-11 15:12

Tipsa en vän
Utskriftsversion

Visual grounding of spati… - Göteborgs universitet Till startsida
Webbkarta
Till innehåll Läs mer om hur kakor används på gu.se

Visual grounding of spatial relations in recurrent neural language models

Konferensbidrag (offentliggjort, men ej förlagsutgivet)
Författare Mehdi Ghanimifard
Simon Dobnik
Publicerad i Workshop on Models and Representations in Spatial Cognition (MRSC-3) at 11th International Conference on Spatial Cognition 2018, 5 September 2018, Tübingen, Germany
Publiceringsår 2018
Publicerad vid Institutionen för filosofi, lingvistik och vetenskapsteori
Språk en
Länkar https://dobnik.net/simon/events/mrs...
Ämnesord spatial recognition, object recognition, image description, neural language model, grounded language model
Ämneskategorier Datorlingvistik

Sammanfattning

The task of automatically describing an image with natural language requires techniques to associate linguistic units with their corresponding visual representations. In the state of the art techniques, most commonly, a pre-trained convolutional neural networks extracts visual features of the image, then a neural language model with attention mechanism will be trained as a decoder to generate descriptions. In this project, we explore the possibility of using the location of objects as explicit features to detect spatial relations between them in the recurrent neural language model.

Sidansvarig: Webbredaktion|Sidan uppdaterades: 2012-09-11
Dela:

På Göteborgs universitet använder vi kakor (cookies) för att webbplatsen ska fungera på ett bra sätt för dig. Genom att surfa vidare godkänner du att vi använder kakor.  Vad är kakor?