JIC:

 

Le monde de la ddécouverte

Télécharger ce cours

 

 

 

 

 

 

Le son numérique

 

Qu'est-ce que le son ?

Le son est une vibration de l'air, c'est-à-dire une suite de surpressions et de dépressions de l'air par rapport à une moyenne, qui est la pression atmosphérique. D'ailleurs pour s'en convaincre, il suffit de placer un objet bruyant (un réveil par exemple) dans une cloche à vide pour s'apercevoir que l'objet initialement bruyant n'émet plus un seul son dès qu'il n'est plus entouré d'air !

La façon la plus simple de reproduire un son actuellement est de faire vibrer un objet. De cette façon un violon émet un son lorsque l'archet fait vibrer ses cordes, un piano émet une note lorsque l'on frappe une touche, car un marteau vient frapper une corde et la fait vibrer.

Pour reproduire des sons, on utilise généralement des haut-parleurs. Il s'agit en fait d'une membrane reliée à un électroaimant, qui, suivant les sollicitations d'un courant électrique va aller en avant et en arrière très rapidement, ce qui provoque une vibration de l'air situé devant lui, c'est-à-dire du son !

 

De cette façon on produit des ondes sonores qui peuvent être représentées sur un graphique comme les variations de la pression de l'air (ou bien de l'électricité dans l'électroaimant) en fonction du temps. On obtient alors une représentation de la forme suivante :

 

Cette représentation d'un son est appelée spectre de modulation d'amplitude (modulation de l'amplitude d'un son en fonction du temps). Le sonogramme représente par contre la variation des fréquences sonores en fonction du temps. On peut remarquer qu'un sonogramme présente une fréquence fondamentale, à laquelle se superposent des fréquences plus élevées, appelées harmoniques.

 

C'est ce qui permet d'arriver à distinguer plusieurs sources sonores : les sons graves auront des fréquences basses, et les sons aigus des fréquences élevées.

Echantillonnage du son

Pour pouvoir représenter un son sur un ordinateur, il faut arriver à le convertir en valeurs numériques, car celui-ci ne sait travailler que sur ce type de valeurs. Il s'agit donc de relever des petits échantillons de son (ce qui revient à relever des différences de pression) à des intervalles de temps précis. On appelle cette action l'échantillonnage ou la numérisation du son. L'intervalle de temps entre deux échantillons est appelé taux d'échantillonnage. Etant donné que pour arriver à restituer un son qui semble continu à l'oreille il faut des échantillons tous les quelques 100 000èmes de seconde, il est plus pratique de raisonner sur le nombre d'échantillons par seconde, exprimés en Hertz (Hz). Voici quelques exemples de taux d'échantillonnage et de qualités de son associées :

Taux d'échantillonnage

Qualité du son

44 100 Hz

qualité CD

22 000 Hz

qualité radio

8 000 Hz

qualité téléphone

La valeur du taux d'échantillonnage, pour un CD audio par exemple, n'est pas arbitraire, elle découle en réalité du théorème de Shannon. La fréquence d'échantillonnage doit être suffisamment grande, afin de préserver la forme du signal. Le théorème de Nyquist - Shannon stipule que la fréquence d'échantillonnage doit être égale ou supérieure au double de la fréquence maximale contenue dans ce signal. Notre oreille perçoit les sons environ jusqu'à 20 000 Hz, il faut donc une fréquence d'échantillonnage au moins de l'ordre de 40 000 Hz pour obtenir une qualité satisfaisante. Il existe un certain nombre de fréquences d'échantillonnage normalisées :

  • 32 kHz : pour la radio FM en numérique (bande passante limitée à 15 kHz)
  • 44.1 kHz : pour l'audio professionnelle et les compact-disques
  • 48 kHz : pour les enregistreuses numériques multipistes professionnelles et l'enregistrement grand public (DAT, MiniDisc...)

Représentation informatique du son

A chaque échantillon (correspondant à un intervalle de temps) est associée une valeur qui détermine la valeur de la pression de l'air à ce moment, le son n'est donc plus représenté comme une courbe continue présentant des variations mais comme une suite de valeurs pour chaque intervalle de temps :

 

L'ordinateur travaille avec des bits, il faut donc déterminer le nombre de valeurs que l'échantillon peut prendre, cela revient à fixer le nombre de bits sur lequel on code les valeurs des échantillons.

  • Avec un codage sur 8 bits, on a 28 possibilités de valeurs, c'est-à-dire 256 valeurs possibles
  • Avec un codage sur 16 bits, on a 216 possibilités de valeurs, c'est-à-dire 65536 valeurs possibles

Avec la seconde représentation, on aura bien évidemment une qualité de son bien meilleure, mais aussi un besoin en mémoire beaucoup plus important.

Enfin, la stéréophonie nécessite deux canaux sur lesquels on enregistre individuellement un son qui sera fourni au haut-parleur de gauche, ainsi qu'un son qui sera diffusé sur celui de droite.

Un son est donc représenté (informatiquement) par plusieurs paramètres :

  • la fréquence d'échantillonnage
  • le nombre de bits d'un échantillon
  • le nombre de voies (une seule correspond à du mono, deux à de la stéréo, et quatre à de la quadriphonie)

Mémoire requise pour stocker un son

Il est simple de calculer la taille d'une séquence sonore non compressée. En effet, en connaissant le nombre de bits sur lequel est codé un échantillon, on connaît la taille de celui-ci (la taille d'un échantillon est le nombre de bits...).

Pour connaître la taille d'une voie, il suffit de connaître le taux d'échantillonnage, qui va nous permettre de savoir le nombre d'échantillons par seconde, donc la taille qu'occupe une seconde de musique. Celle-ci vaut :
Taux d'échantillonnage x Nombre de bits

Ainsi, pour savoir l'espace mémoire que consomme un extrait sonore de plusieurs secondes, il suffit de multiplier la valeur précédente par le nombre de secondes :
Taux d'échantillonnage x Nombre de bits x Nombre de secondes

Enfin, la taille finale de l'extrait est à multiplier par le nombre de voies (elle sera alors deux fois plus importante en stéréo qu'en mono...).
La taille en bits d'un extrait sonore est ainsi égale à :

Taux d'échantillonnage x Nombre de bits x Nombre de secondes x Nombre de voies

Présentation du format MP3

 

Le MP3 (« MPEG Audio layer 3 ») est un format de compression de données audio par destruction de données, développé par l'organisation de standardisation internationale (ISO). Ce format permet de compresser à un taux de 1:12 les formats audio habituels (WAV ou CD audio).

 

Il permet de faire tenir l'équivalent en fichiers de douze albums de musique sur un seul CD-ROM. De plus, le format mp3 n'altère que faiblement le son pour l'oreille humaine.

 

Le contexte

 

En fait la compression MPEG layer 3 consiste à retirer des données audio les fréquences inaudibles pour l'auditeur moyen dans des conditions habituelles d'écoute. La compression vise donc à analyser les composantes spectrométriques d'un signal audio, et de leur appliquer un modèle psycho acoustique pour ne conserver que les sons « audibles ». L'oreille humaine est capable de discerner, en moyenne, des sons entre 0.02 kHz et 20 kHz, sachant que sa sensibilité est maximale pour des fréquences entre 2 et 5 kHz (la voix humaine est entre 0.5 et 2 kHz), suivant une courbe donnée par la loi de Fletcher et Munson.

 

La compression consiste à déterminer les sons que nous n'entendons pas et à les supprimer, il s'agit donc d'une compression destructive, c'est-à-dire avec une perte d'information.

 

Les procédés

 

L'effet de masque

 

Gabriel Bouvigne explique :

« Lorsque vous regardez le soleil et qu'un oiseau passe dans son axe, vous ne le voyez pas car la lumière provenant du soleil est trop importante. En acoustique, c'est similaire. Lorsqu'il y a des sons de fort volume sonore, vous n'entendez pas les sons faibles. Prenez l'exemple d'un orgue : lorsqu'un organiste ne joue pas, vous entendez le souffle dans les tuyaux, et quand il joue, vous ne l'entendez plus car il est masqué.

 

Il n'est donc pas essentiel d'enregistrer tous les sons, c'est la première propriété utilisée par le format MP3 pour gagner de la place. »

 

Le réservoir de bytes

 

Souvent, certains passages d'une musique ne peuvent pas être encodés sans altérer la qualité. Le mp3 utilise donc un petit réservoir de bytes qui agit en utilisant des passages qui peuvent être encodés à un taux inférieur au reste des données.

Le joint stereo

 

Dans beaucoup de chaînes hi-fi, il y a un boomer unique (qui produit les basses). Cependant on n'a pas l'impression que le son vient de ce boomer mais plutôt des haut-parleurs satellites. En effet, en dessous d'une fréquence donnée l'oreille humaine est incapable de localiser l'origine du son. Le format mp3 peut exploiter (en option) cette astuce en utilisant la méthode du joint stéréo. C'est-à-dire que certaines fréquences sont enregistrées en mono mais elles sont accompagnées d'informations complémentaires afin de restituer un minimum d'effet spatial.

 

Le code Huffman

 

La technique de l'algorithme Huffman est un algorithme de codage (et non de compression), qui agit à la fin de la compression, en créant des codes de longueurs variables sur un grand nombre de bits. Les codes ont l'avantage d'avoir un préfixe unique, ils peuvent toutefois être décodés correctement malgré leur longueur variable, et rapidement grâce à une correspondance de tables. Ce type d'encodage permet de gagner en moyenne un peu moins de 20% d'espace.

 

Lorsque les sons sont « purs » (lorsqu'il n'y a pas de masquage) l'algorithme Huffman est très efficace car le son digitalisé contient de nombreux sons redondants.

 

Les résultats

 

Ainsi, une minute d'un CD-audio (à une fréquence de 44.1 kHz, 16 bits, stéréo) ne prendra qu'un seul Mo.

Une chanson fait donc en moyenne 3 ou 4 Mo, ce qui rend son téléchargement possible même avec un modem.

Bande passante

Mode

Débit

Qualité

Compression

11.025

Mono

8 kbps

Très mauvaise

200:1

11.025

Stéréo

64 kbps

Mauvaise

25:1

22.050

Stéréo

96 kbps

Acceptable

16:1

44.100

Stéréo

128 kbps

Bonne

12:1

44.100

Stéréo

196 kbps

Très bonne

12:1

 


 

La décompression d'un fichier MP3 (c'est-à-dire la lecture) se fait en temps réel avec un P166, mais monopolise une grande partie des ressources système, c'est pourquoi il est déconseillé (à moins d'avoir une bête de course) de lancer une autre application gourmande en mémoire pendant la lecture.

 

La législation

 

Le format MP3 n'est pas illégal, car il représente uniquement une façon de compresser des données numériques. Par contre son utilisation peut l'être. Lors de l'utilisation de fichiers Mp3, veillez à respecter les droits d'auteur : vous pouvez faire une copie (de sauvegarde) d'une chanson dont vous possédez l'original, mais vous ne pouvez pas télécharger ou archiver une musique d'un artiste dont les droits d'utilisation ne sont pas libérés. Il est ainsi fort peu probable que la chanson que vous rêvez de télécharger (chanson diffusée à la radio, ...) puisse légalement l'être.

 

Présentation du format Ogg Vorbis

 

Ogg Vorbis est un format de compression de données audio développé par la fondation Xiph.org.

 

Comme pour le format MP3, il s'agit d'une compression par destruction de données audio, dite « compression avec pertes » (en anglais lossy compression), c'est-à-dire en éliminant quelques informations auditives (fréquences non audibles par exemple) afin d'obtenir le meilleur taux de compression possible, tout en gardant un résultat qui soit le plus proche possible des données originales.

 

Le format Ogg Vorbis a ceci de particulier qu'il s'agit d'un format ouvert, contrairement aux principaux formats concurrents tels que le MP3, WMA, Atrac ou AAC. Ceci signifie notamment que l'algorithme de compression peut être utilisé librement par les développeurs de logiciels, ce qui a abouti au développement et à la mise à disposition de nombreux utilitaires et librairies libres de droit (Open Source).

 

Caractéristiques techniques

 

Ogg Vorbis utilise un encodage à débit variable (en anglais Variable Bit Rate, noté VBR), c'est-à-dire un encodage permettant d'adapter le nombre de bits utilisés par seconde pour encoder les données audio, selon la complexité du flux audio à un moment donné. En clair, cela signifie que le volume de données pour encoder une séquence sonore ne sera pas le même selon qu'il s'agit de silence ou d'un concert polyphonique.

 

Alors que le format MP3 ne permet d'enregistrer que sur deux canaux maximum (en stéréo), le format Ogg Vorbis permet un enregistrement polyphonique (plusieurs canaux) et permet ainsi une restitution sur des installations utilisant 4, 5 (5.1) ou 7 (7.1) canaux.

 

Étant donné que le format Ogg Vorbis est plus récent que le format MP3 (la version 1.0 du format Ogg Vorbis date du lundi 8 mai 2000), il permet une bien meilleure restitution sonore, dans la bande de fréquence 8kHz-48.0kHz.

 

Enfin, les fichiers au format Ogg Vorbis sont globalement plus petits que les fichiers au format MP3.

 

Les fichiers ci-dessous, mis à disposition par la fondation Xiph.org, permettent de comparer la qualité des différents formats de compression audio :

 

Compilation n°1

Ogg Vorbis

WMA8

MP3
(LAME 3.91)

MP3Pro

bitrate moyen (128 kbps)

.ogg
.wav

.wma
.wav

.mp3
.wav

 

bitrate bas (64 kbps)

.ogg
.wav

.wma
.wav

.mp3
.wav

.mp3
.wav

 

Compatibilité

 

Le format Ogg Vorbis n'est pas compatible avec le format MP3, ce qui signifie qu'il faut utiliser un lecteur supportant le format ou installer un codec spécifique pour pouvoir donner aux lecteurs existants la capacité de lire des fichiers au format Ogg Vorbis.

 

Néanmoins, de plus en plus de lecteurs logiciels permettent de lire des fichiers au format Ogg Vorbis et la plupart des lecteurs MP3 matériels récents supportent ce format.

 

Ce document intitulé « Le son numérique » publier par inforcor.jimdo est issu de Comment Ça Marche est mis à disposition sous les termes de la licence Creative Commons. Vous pouvez copier, modifier des copies de cette page, dans les conditions fixées par la licence, tant que cette note apparaît clairement.

 

...........................................................................................................................................................

 

 

 

 

 

 

Le Prémier rubrique de notre site.

 

Titre: Histoire de l'internet. 

 

 

 

                                   

                     J2nk Info Corporation

   Le monde de la découverte

 

Histoire d’internet

 

En 1962, alors que le communisme faisait force, l'US Air Force demande à un petit groupe de chercheurs de créer un réseau de communication militaire capable de résister à une attaque nucléaire. Le concept de ce réseau reposait sur un système décentralisé, permettant au réseau de fonctionner malgré la destruction d'une une ou plusieurs machines.

Le modèle de Baran

                                                                                

Paul Baran est considéré comme un des acteurs principaux de la création d'Internet. Il eu l'idée, en 1964, de créer un réseau sous forme de grande toile. Il avait réalisé qu'un système centralisé était vulnérable car la destruction de son noyau provoquait l'anéantissement des communications. Il mit donc au point un réseau hybride d'architectures étoilées et maillées dans lequel les données se déplaceraient de façon dynamique, en « cherchant » le chemin le moins encombré, et en « patientant » si toutes les routes étaient encombrées. Cette technologie fut appelé « packet switching ».

L'ARPANET

 

En 1969, le réseau expérimental ARPANET fut créé par l'ARPA (Advanced Research Projects Agency dépendant du DOD, Department of Defense) afin de relier quatre instituts universitaires :

Le Stanford Institute

L'université de Californie à Los Angeles

L'université de Californie à Santa Barbara

L'université d'Utah

 

Le réseau ARPANET est aujourd'hui considéré comme le réseau précurseur d'internet. Il comportait déjà à l'époque certaines caractéristiques fondamentales du réseau actuel :

Un ou plusieurs nœuds du réseau pouvait être détruits sans perturber son fonctionnement ;

La communication entre machines se faisait sans machine centralisée intermédiaire ;

Les protocoles utilisés étaient basiques.

Le courrier électronique

 

En 1972 Ray Tomlinson mit au point un nouveau mode de communication : le courrier électronique. Le contenu de ce premier e-mail était le suivant :

QWERTYUIOP

 

Par ailleurs, le caractère « @ » servait déjà à séparer le nom de l'utilisateur du nom de la machine dans les adresses.

 

En juillet 1972, Lawrence G. Roberts améliora les possibilités ouvertes par Ray Tomlinson en développant la première application permettant de lister, de lire de manière sélective, d'archiver, de répondre ou de faire suivre un e-mail. Dès lors, la messagerie électronique n'aura de cesse de croître, pour devenir la principale utilisation du réseau des réseaux au début du XXIe siècle.

 

C'est également en 1972 (octobre 1972) que le réseau ARPANET fut présenté pour la première fois au grand public, lors de la conférence ICCC (International Computer Communication Conference). A cette même époque, l'ARPA devint le DARPA (Defense Advanced Research Projects Agency) et le terme « internetting » est utilisé pour désigner l'ARPANET, devenant alors un embryon d'internet.

Le protocole TCP

Le protocole NCP, utilisé jusqu'alors, ne permettait pas de gérer de contrôle d'erreur et était donc par principe uniquement utilisable sur le réseau ARPANET, dans la mesure où l'infrastructure était correctement maîtrisée.

 

Ainsi Bob Kahn, arrivé à l'ARPA depuis 1972, commença à travailler sur les bases d'un nouveau protocole, déjà baptisé TCP, permettant d'acheminer des données sur un réseau en les fragmentant en petits paquets.

 

Au printemps 1973, il demanda à Vinton Cerf (alors à Stanford) de l'aider à bâtir le protocole.

 

En 1976, le DoD décida de déployer le protocole TCP sur le réseau ARPANET, composé de 111 machines reliées entre elles.

 

En 1978, le protocole TCP fut scindé en deux protocoles : TCP et IP, pour constituer ce qui allait devenir la suite TCP/IP.

Le DNS

 

Le système de nommage DNS, utilisé de nos jours, fut mis en œuvre en 1984, afin de pallier le manque de souplesse du nommage par table de nommage, demandant la mise à jour manuelle des correspondances entre le noms de machines et leur adresse sur des fichiers textes sur chacune des machines.

Les RFC

 

En 1969, S. Crocker (alors à l'université de California) met au point le système « Request for Comments » (RFC). Il s'agit de documents présentés sous forme de note, permettant aux chercheurs d'échanger leurs travaux.

 

Jon Postel (6 août 1943 - 16 octobre 1998) fut chargé de l'administration de ces documents jusqu'à sa mort.

Le World Wide Web

                                                                                                                       

Dès 1980, Tim Berners-Lee, un chercheur au CERN de Genève, mit au point un système de navigation hypertexte et développa, avec l'aide de Robert Cailliau, un logiciel baptisé Enquire permettant de naviguer selon ce principe.

 

Fin 1990, Tim Berners-Lee met au point le protocole HTTP (Hyper Text Tranfer Protocol), ainsi que le langage HTML (HyperText Markup Language) permettant de naviguer à l'aide de liens hypertextes, à travers les réseaux. Le World Wide Web est né.

 

   Ce document intitulé « Histoire d'internet » Publier par www.infocor.jimdo.com est issu de Comment Ça Marche est mis à disposition sous les termes de la licence Creative Commons. Vous pouvez copier, modifier des copies de cette page, dans les conditions fixées par la licence, tant que cette note apparaît clairement. www.commentcamarche.net                           

 

 

 

 

 

 

 

  ........................................................................................................................................................

 

 

© 2012 – 2014 Infocorpor pour J2nk Info Corporation, Tout droits réservés.

Service client : +243 89 931 3590, email : jus.simon@yahoo.frwww.infocor.jimdo.com 54, Zatumua Q/Révolution Cité/Mbanza-ngungu, République Démocratique du Congo