Batch

Un « batch » en annotation de données (« lot de données ») fait référence à un set de données qui sont traitées ensemble pour l’annotation. Les “batchs” sont souvent utilisés pour diviser un set de données important en unités plus petites et faciles à gérer, ce qui permet une annotation et un suivi plus efficace.

La taille du batch peut varier en fonction des exigences et des contraintes spécifiques du projet. Il peut comprendre des centaines, des milliers de données ou plus. Sa taille est souvent déterminée en fonction de la taille du jeu de données total, la complexité des données, du temps et des ressources disponibles pour les étiqueter ou les annoter.

Il convient de noter que le terme « batch » est parfois confondu avec le terme « dataset », qui fait référence à un lot de données plus important. Alors qu’un batch représente une unité de données plus petite, destinée à l’étiquetage, un dataset peut être divisé en plusieurs batchs. Un dataset peut aussi comporter des informations supplémentaires telles que des métadonnées ou des annotations.