Boîte Englobante

Une boîte englobante (bounding box) est un contour rectangulaire tracé autour d’un objet ou d’une région d’intérêt dans une image. Les boîtes englobantes sont fréquentes pour annoter des images dans projets d’apprentissage automatique, telles que la détection d’objets ou classification.

Les bounding boxes représentent une des façons les plus rapides et les plus communes d’annoter des objets.

Pour sa création, l’annotateur dessine un rectangle autour de l’objet/région d’intérêt dans l’image, en utilisant un outil d’annotation des données. La boîte englobante est généralement définie par deux coordonnées (x,y) et sert à délimiter les contours de l’objet d’intérêt.

Les boîtes englobantes peuvent annoter une large variété d’objets ou de régions dans les images, tels que des personnes, des animaux, des bâtiments, des véhicules, et bien d’autres. Souvent combinées avec d’autres types d’annotations, les Bbox fournissent des informations supplémentaires sur les objets et les régions représentés. Deux exemples d’annotations qui accompagnent les Bbox sont les classes (pour identifier un objet, comme « pomme », « poire », « orange ») et les attributs (pour ajouter des détails spécifiques à l’objet, comme le niveau de maturité, l’occlusion, etc.).

Il est parfois intéressant de faire pivoter les bounding boxes pour mieux localiser certains objets. Il s’agit d’une fonctionnalité de certains outils d’annotation appelée “oriented bounding box” ou « boîte englobante orientée ».

Synonyms: Bounding Box; Bbox; BB