Limites de compréhension de la vidéo

Voici les principales limites du modèle, pour lesquelles la précision et les performances ne peuvent être garanties.

Une vidéo par demande : actuellement, le modèle ne prend en charge qu’une seule vidéo par demande. Certains cadres et bibliothèques utilisent la mémoire pour garder une trace des interactions précédentes. Il se peut qu’une vidéo ait été ajoutée dans un contexte précédent.
Pas de prise en charge audio : les modèles sont actuellement entraînés pour traiter et comprendre le contenu vidéo uniquement sur la base des informations visuelles contenues dans la vidéo. Ils ne possèdent pas la capacité d’analyser ou de comprendre les composants audio présents dans la vidéo.
Causalité temporelle : le modèle a une compréhension limitée de la causalité des événements tout au long de la progression de la vidéo. Bien qu’il réponde bien aux questions ponctuelles, il n’est pas aussi performant pour les réponses qui dépendent de la compréhension d’une séquence d’événements
Compréhension multilingue des images : les modèles ont une compréhension limitée des images et des images vidéo multilingues. Ils peuvent rencontrer des difficultés ou présenter des erreurs lors de tâches similaires.
Identification des personnes : les modèles Amazon Nova ne prennent pas en charge la capacité d’identifier ou de nommer des personnes dans des images, des documents ou des vidéos. Les modèles refuseront d’effectuer de telles tâches.
Raisonnement spatial : les modèles Amazon Nova ont des capacités de raisonnement spatial limitées. Ils peuvent rencontrer des difficultés avec les tâches qui nécessitent une localisation précise ou une analyse de la disposition.
Petit texte dans les images ou les vidéos : si le texte dans l’image ou la vidéo est trop petit, envisagez d’augmenter la taille relative du texte dans l’image en recadrant la section concernée tout en conservant le contenu nécessaire.
Comptage : les modèles Amazon Nova peuvent fournir un nombre approximatif d’objets dans une image, mais ils ne sont pas toujours précis, en particulier lorsqu’il s’agit d’un grand nombre de petits objets.
Contenu inapproprié : les modèles Amazon Nova ne traitent pas les images inappropriées ou explicites qui enfreignent la politique d’utilisation acceptable
Applications médicales : en raison de la nature sensible de ces artefacts, même si les modèles Amazon Nova peuvent fournir une analyse générale des images ou vidéos médicales, nous vous déconseillons d’interpréter des scans diagnostiques complexes. La réponse d’Amazon Nova ne doit en aucun cas être considérée comme un substitut à un avis médical professionnel.

Avertissement JavaScript est désactivé ou n'est pas disponible dans votre navigateur.

Pour que vous puissiez utiliser la documentation AWS, Javascript doit être activé. Vous trouverez des instructions sur les pages d'aide de votre navigateur.

Conventions de rédaction

Limites de compréhension de la vidéo

Exemples de compréhension de vidéos