FFmpeg De Débutant à Experts: Analyse d'un fichier média avec FFMPEG

Voici les principaux points d'analyse fournis par FFmpeg

Le stream

Stream : un flux est une séquence continue de données qui représente une composante spécifique d'un fichier multimédia. Les fichiers multimédias peuvent contenir plusieurs flux, chacun ayant ses propres métadonnées. Les flux sont utilisés par les lecteurs multimédias pour décoder et afficher correctement les données du fichier. Le type de média peut-être : la vidéo, l'audio, le sous-titrage, le chapitrage et les métadonnées.

Input #0, Input #1, etc. : Ces lignes indiquent les flux d'entrée détectés par FFmpeg. Dans le cas d'un fichier vidéo, il y a généralement deux flux : un pour la vidéo et un pour l'audio.
Stream #0:0: Cette ligne indique le premier flux d'entrée, qui est généralement la vidéo. Elle fournit des informations détaillées sur le codec utilisé, la résolution, le taux de trame, etc. Exemple : Stream #0:0(und): Video: h264 (High) (avc1 / 0x31637661), yuv420p, 1280x720 [SAR 1:1 DAR 16:9], 29.97 fps, 5115 kb/s, 29.97 tbr, 16k tbn, 59.94 tbc
Stream #0:1: Cette ligne indique le deuxième flux d'entrée, qui est généralement l'audio. Elle fournit des informations détaillées sur le codec utilisé, le débit binaire, le nombre de canaux, etc. Exemple : Stream #0:1(eng): Audio: aac (LC) (mp4a / 0x6134706D), 48000 Hz, stereo, fltp, 128 kb/s
Flux de sous-titres : Les flux de sous-titres sont des flux de données qui contiennent des informations textuelles affichées à l'écran pendant la lecture de la vidéo. Dans les flux d'entrée affichés par FFmpeg, vous pouvez voir les flux de sous-titres après les flux vidéo et audio. Exemple, un flux de sous-titres de type mov_text dans ce fichier vidéo : Stream #0:2(eng): Subtitle: mov_text (text / 0x74786574)
Flux de chapitrage : Les flux de chapitrage sont des flux de données qui contiennent des informations sur la structure de la vidéo, tels que les chapitres, les segments ou les marqueurs. Dans les flux d'entrée affichés par FFmpeg, vous pouvez voir les flux de chapitrage après les flux vidéo, audio et de sous-titres. Exemple, un flux de chapitrage dans ce fichier vidéo, qui commence à 0 heure, 0 minute et 0 seconde : Stream #0:3: Chapter: 00:00:00.000

La vidéo

La vidéo : le flux vidéo est une séquence continue de données qui représente la composante vidéo d'un fichier multimédia. Il contient les images et les informations nécessaires pour afficher la vidéo, telles que la résolution, le débit binaire, le codec et le taux de trame. Les flux vidéo peuvent être encodés dans différents formats et codecs, tels que H.264, H.265, VP9, MPEG-2, etc. Le choix du codec dépend de plusieurs facteurs, tels que la qualité, la complexité, la compatibilité et la taille du fichier

Duration: Cette ligne indique la durée totale du flux d'entrée en heures, minutes, secondes et millisecondes.
Bitrate: Le débit binaire est la quantité de données transmises ou stockées par unité de temps, exprimée en bits par seconde. Par exemple, dans la ligne suivante, le débit binaire vidéo est de 5115 kilobits par seconde : Stream #0:0(und): Video: h264 (High) (avc1 / 0x31637661), yuv420p, 1280x720 [SAR 1:1 DAR 16:9], 29.97 fps, 5115 kb/s, 29.97 tbr, 16k tbn, 59.94 tbc
Codec: Cette ligne indique le codec utilisé pour encoder le flux d'entrée. Pour la vidéo, il peut s'agir de H.264, H.265, VP9, etc. Par exemple, dans la ligne suivante, le codec vidéo est H.264, identifié par "avc1" et "High : Stream #0:0(und): Video: h264 (High) (avc1 / 0x31637661), yuv420p, 1280x720 [SAR 1:1 DAR 16:9], 29.97 fps, 5115 kb/s, 29.97 tbr, 16k tbn, 59.94 tbc
Width x Height: Cette ligne indique la résolution de la vidéo en pixels. Par exemple, dans la ligne suivante, la dimension de la vidéo est de 1280x720 pixel : Stream #0:0(und): Video: h264 (High) (avc1 / 0x31637661), yuv420p, 1280x720 [SAR 1:1 DAR 16:9], 29.97 fps, 5115 kb/s, 29.97 tbr, 16k tbn, 59.94 tbc
Frame rate: Cette ligne indique le taux de trame de la vidéo en images par seconde. Par exemple, dans la ligne suivante, le taux de trame vidéo est de 29,97 images par seconde, Stream #0:0(und): Video: h264 (High) (avc1 / 0x31637661), yuv420p, 1280x720 [SAR 1:1 DAR 16:9], 29.97 fps, 5115 kb/s, 29.97 tbr, 16k tbn, 59.94 tbc
SAR (Sample Aspect Ratio) : Le rapport d'échantillonnage d'aspect (SAR) est le rapport entre la largeur et la hauteur d'un échantillon de pixel dans une image numérique. Il est utilisé pour représenter la forme réelle d'une image lorsque la résolution de l'image ne correspond pas à un multiple entier de la résolution de sortie. Par exemple, si une image a une résolution de 720x480 pixels et un SAR de 1:1, cela signifie que chaque pixel est carré. Cependant, si le SAR est de 10:11, cela signifie que chaque ligne horizontale de pixels est 10% plus large que haute, et donc que les pixels ne sont pas carrés.
DAR (Display Aspect Ratio) : Le rapport d'aspect d'affichage (DAR) est le rapport entre la largeur et la hauteur de l'image affichée à l'écran. Il est généralement exprimé en largeur divisée par la hauteur, par exemple 16:9 ou 4:3. Le DAR est utilisé pour déterminer la forme de l'image affichée à l'écran.
YUV : YUV est un format de couleur utilisé dans la compression vidéo. Il sépare les composantes de luminance (Y) et de chrominance (U et V) de l'image. La composante Y représente la luminance ou la luminosité de l'image, tandis que les composantes U et V représentent les différences de couleur par rapport à la luminance. Le format YUV est utilisé dans de nombreux codecs vidéo, tels que H.264, VP9 et MPEG-2.

L'audio

L'audio : Un flux audio est une séquence continue de données qui représente la composante audio d'un fichier multimédia. Il contient les sons et les informations nécessaires pour lire l'audio, telles que le format, le débit binaire, le nombre de canaux et l'échantillonnage. Les flux audio peuvent être encodés dans différents formats et codecs, tels que AAC, MP3, Vorbis, Opus, etc. Le choix du codec dépend de plusieurs facteurs, tels que la qualité, la complexité, la compatibilité et la taille du fichier.

Codec : Le codec est le format de compression utilisé pour encoder les données du flux audio. Par exemple, dans la ligne suivante le codec audio est AAC, identifié par "mp4a : Stream #0:1(eng): Audio: aac (LC) (mp4a / 0x6134706D), 48000 Hz, stereo, fltp, 128 kb/s (eng)
Fréquence d'échantillonnage : La fréquence d'échantillonnage est le nombre d'échantillons par seconde. Par exemple, dans la ligne suivante, la fréquence d'échantillonnage audio est de 48000 Hz : Stream #0:1(eng): Audio: aac (LC) (mp4a / 0x6134706D), 48000 Hz, stereo, fltp, 128 kb/s (eng)
Nombre de canaux : Le nombre de canaux est le nombre de voies audio distinctes. Par exemple, dans la ligne suivante, le nombre de canaux audio est stéréo : Stream #0:1(eng): Audio: aac (LC) (mp4a / 0x6134706D), 48000 Hz, stereo, fltp, 128 kb/s (eng)
Débit binaire : Le débit binaire est la quantité de données transmises ou stockées par unité de temps, exprimée en bits par seconde. Par exemple, dans la ligne suivante, Le débit binaire audio est de 128 kilobits par seconde : Stream #0:1(eng): Audio: aac (LC) (mp4a / 0x6134706D), 48000 Hz, stereo, fltp, 128 kb/s (eng)
Langue : La langue est la langue utilisée pour les sous-titres ou les flux audio. Par exemple, dans la ligne suivante, la langue de l'audio est l'anglais, identifié par "eng" : Stream #0:1(eng): Audio: aac (LC) (mp4a / 0x6134706D), 48000 Hz, stereo, fltp, 128 kb/s (eng)

Résumé

En résumé, la commande ffmpeg -i input.mp4 fournit des informations détaillées sur les flux d'entrée, les codecs utilisés, la résolution, la durée, le débit binaire, et d'autres paramètres importants du fichier vidéo input.mp4. Ces informations peuvent être utiles pour diagnostiquer des problèmes de lecture ou de transcodage, ou pour planifier des opérations de conversion ou de montage vidéo.

Analyse d'un fichier média avec FFMPEG

Voici les principaux points d'analyse fournis par FFmpeg

Le stream

La vidéo

L'audio

Résumé

Nous connaître

Les cours en ligne

Contact