On The Automated Selection of Viewpoints for Image Based Maps

Abstract

English

This thesis presents an approach to the automated construction of visual maps, in the form of walk-throughs, of an unknown environment. Our approach is based on the selection of informative viewpoints within the environment. These viewpoints are locations in the environment which correspond to views containing maximal visual interest. This approach to environment representation is analogous to image compression. Our goal is to obtain a set of selections resembling those made by a human observer given the same task.

Our computational procedure is inspired by models of human visual attention outlined in the literature on human psychophysics. We make use of the underlying edge structure of a scene, as it is largely unaffected by variations in illumination. Our implementation uses a mobile robot to traverse the environment, and then builds an image-based virtual representation of the environment, only keeping the views whose responses were highest. We demonstrate the effectiveness of our attention operator on both single images, and in viewpoint selection within an unknown environment.

Français

Cette thèse présente une approche à la construction automatisée de scènes de réalité virtuelle basée sur des images d'un environnement inconnu en permettant à l'usager de contrôler ses déplacements. Notre approche est basée sur la sélection de points de vue informatifs situés dans l'environnement. Ces points de vue sont des emplacements dans l'environnement qui correspondent aux vues suscitant un intérêt visuel maximale. Cette approche à la repésentation de l'environnement est analogue à la compression d'images. Notre but consiste à obtenir un ensemble de sélections s'apparentant à celles qu'effectuerait un observateur humain dans une même tâche donnée. Notre procédure de calculs s'inspire des modèles d'attention visuelle rapportés dans la littérature de psychophysique humaine. Nous utilisons le contour de la structure sous-jacente d'une scène puisqu'elle n'est pas grandement affectée par les variations d'éclairage. Notre application a recours à un robot mobile pour effectuer la traversée de l'environnement, puis construit une représentation virtuelle de l'environnement basée sur des images, ne conservant que les vues évoquant le plus grand nombre de réponses. Nous démontrons l'efficacité de notre opérateur d'attention sur des images individuelles ainsi que sur la sélection de points de vue à l'intérieur d'un environnement inconnu.