Till sidans topp

Sidansvarig: Webbredaktion
Sidan uppdaterades: 2012-09-11 15:12

Tipsa en vän
Utskriftsversion

Knowing When to Look For … - Göteborgs universitet Till startsida
Webbkarta
Till innehåll Läs mer om hur kakor används på gu.se

Knowing When to Look For What and Where: Evaluating Generation of Spatial Descriptions with Adaptive Attention

Paper i proceeding
Författare Mehdi Ghanimifard
Simon Dobnik
Publicerad i Computer Vision – ECCV 2018 Workshops
ISBN 978-3-030-11017-8
Förlag Springer International Publishing
Publiceringsår 2019
Publicerad vid Institutionen för filosofi, lingvistik och vetenskapsteori
Språk en
Länkar https://sites.google.com/view/sivl/...
https://gup.ub.gu.se/file/207626
Ämnesord image descriptions, grounded neural language model, attention model, spatial descriptions
Ämneskategorier Människa-datorinteraktion (interaktionsdesign), Bildanalys, Datorlingvistik, Språkteknologi (språkvetenskaplig databehandling), Datorseende och robotik (autonoma system)

Sammanfattning

We examine and evaluate adaptive attention in (Lu et al. 2017) (which balances the focus on visual features and focus on textual features) in generating image captions in end-to-end neural networks, in particular how adaptive attention is informative for generating spatial relations. We show that the model generates spatial relations more on the basis of textual rather than visual features and therefore confirm the previous observations that the learned visual features are missing information about geometric relations between objects.

Sidansvarig: Webbredaktion|Sidan uppdaterades: 2012-09-11
Dela:

På Göteborgs universitet använder vi kakor (cookies) för att webbplatsen ska fungera på ett bra sätt för dig. Genom att surfa vidare godkänner du att vi använder kakor.  Vad är kakor?