From image descriptions to visual denotations: New similarity metrics for semantic inference over event descriptions

Peter Young; Alice Lai; Micah Hodosh; Julia Hockenmaier

Vol. 2 (2014)

TACL approved

From image descriptions to visual denotations: New similarity metrics for semantic inference over event descriptions

Published 2014-02-28

Peter Young
Alice Lai
Micah Hodosh
Julia Hockenmaier

Peter Young
University of Illinois at Urbana-Champaign

Alice Lai
University of Illinois at Urbana-Champaign

Micah Hodosh
University of Illinois at Urbana-Champaign

Julia Hockenmaier
University of Illinois at Urbana-Champaign

Abstract

We propose to use the visual denotations of linguistic expressions (i.e. the set of images they describe) to define novel denotational similarity metrics, which we show to be at least as beneficial as distributional similarities for two tasks that require semantic inference. To compute these denotational similarities, we construct a denotation graph, i.e. a subsumption hierarchy over constituents and their denotations, based on a large corpus of 30K images and 150K descriptive captions.

PDF (Presented at ACL 2014)