idée de nouveau format son.... à méditer -> recherche codeur pour aide

Marsh Posté le 17-10-2001 à 14:02:57

j'ai eu une petite idée de nouveau format audio qui pourrait être interessant si on pousse un peu l'idée....

plutôt que de coder toute l'onde audio comme c'est fait en wav par exemple ou de compresser les donnée (cf mp3 et autres) pourquoi ne pas procéder par interpolations ?

j'explique : on prend l'onde de base, on échantillone suffisament de points et si on les interpole (par exemple avec un polynôme de Lagrange ou de Legendre) et en ne stockant dans le fichier que les coefs des différents termes, ou pourrait assez facilement "approcher" l'onde de base, comme avec Fourrier mais avec moins de calcul (l'algo d'interpolation est trivial)

Donc je voudrais connaitre votre expérience en la matière et uje recherche des personnes interessées...

Reply

Marsh Posté le 17-10-2001 à 14:02:57

Reply

Marsh Posté le 17-10-2001 à 14:04:42

il me semble que c'est déja ce que fait le mp3, en plus que de supprimé les sons "inaudibles".

Reply

Marsh Posté le 17-10-2001 à 14:08:43

il ne me semble pas

Reply

Marsh Posté le 17-10-2001 à 14:09:22

ilme semble aussi

---------------

Reply

Marsh Posté le 17-10-2001 à 14:14:45

si je me rappelle bien, ils travaillent même plutot avec les transformées de fourier.

Reply

Marsh Posté le 17-10-2001 à 14:16:24

le MPEG 3 ne fait pas de fourier, il me semble qu'il est basé sur les arbres de hoffman, il compresse des données, pas l'onde en elle meme, enfin, sauf erreur de ma part....

Reply

Marsh Posté le 17-10-2001 à 14:40:08

yep, je viens de vérifier, c'est bien Huffman, qu'ils utilisent. Pourtant je reste persuadé d'avoir vu une data sheet sur un format de son basé sur les transformée de fourier.

Reply

Marsh Posté le 17-10-2001 à 14:42:57

pour le mp3 3 choses (pour résumer) :
une passe transformée discrète de fourrier
une passe suppression des son inaudible en s'appuiyant sur un modèle psychoaccoustique
une passe algo de Huffman pour stocké les coefs restant de la DCT

Pour ton polynome de Lagrange : ça peut fonctionner sur un wav de 1 seconde à la rigueure, mais est ce que tu vois le calcul qu'il faut pour approximer une onde de 44100 points * nb secondes ?
et après le rendu ?
perso je doute que ce soit génial
(Pour déterminer le second point de ton polynome il te faut calculer tout le morceau)

Par contre je me demande si une compression à base de réseau de neurones pouvait être utilisé et surtout efficace, la musique ayant des règles de corrélation assez fortes (le rythme, les plages de fréquences précises pour chaque instrument, déduction des harmoniques...)

Reply

Marsh Posté le 17-10-2001 à 14:45:42

ce que je comptait faire (car en effet, il serait suicidaire de coder tout un morceaux en 1 seul polynome, sachant que si on prend X point, on a un polynome de degré X....) mais prendre des séquences de 0.2 à 0.5 secondes et sur cet intervalle faire une interpolation de 5-6 points (ca serait à bidouiller pour trouver un truc acceptable).

Et là, le calcul devient faisable.

Reply

Marsh Posté le 17-10-2001 à 14:52:18

les jointure entre tes polynomes risquent d'etre mauvaises ...

---------------
Hyndex - Meuaarf !! ReZo !!!

Reply

Marsh Posté le 17-10-2001 à 14:52:18

Reply

Marsh Posté le 17-10-2001 à 14:53:53

après on doit mathématiquement pouvoir virer les effet de bord (quitte à interpoler le dernier le dernier point d'une série avec le premier de la suivante)

Reply

Marsh Posté le 17-10-2001 à 15:01:01

Le mieux c'est d'utiliser des splines... mais j'ai peur que ce soit plus volumineux encore...

Reply

Marsh Posté le 17-10-2001 à 15:02:05

sinon je viens de tomber sur un site qui explique la méthode des moindres carrés de Gauss (pour ceux qui connaisent un peu, cela revient à minimiser la norme 2 d'un nuage de vecteurs par une application f)

Reply

Marsh Posté le 17-10-2001 à 15:07:27

Tu as quoi comme machine pour tes moindre carres ??

Reply

Marsh Posté le 17-10-2001 à 15:13:43

faut pas de truc trop gros... de même que pour les polynome d'interpolation (dont je pense que le résultat sera meilleur) tant que tu demande pas trop de points d'un coup.

Reply

Marsh Posté le 17-10-2001 à 15:27:39

Kyle_Katarn a écrit a écrit :

faut pas de truc trop gros... de même que pour les polynome d'interpolation (dont je pense que le résultat sera meilleur) tant que tu demande pas trop de points d'un coup.

Tu n'as pas peur de perdre les hautes frequences au profit des basses...
Et tu le defini comment ton polynome... je te propose des splines, mais a mon avis il va te falloir une grosse machine...

[edtdd]--Message édité par BENB--[/edtdd]

Reply

Marsh Posté le 17-10-2001 à 18:54:58

je sais pas trop encore quand je coderai ça... ptet au fur et à mesure...

je aucune connaissance en structure de ficheir wav, or il me faut connaitre ça avant de coder quoi que ce soit....

j'ai aucune idée de la qualité que ça aura, c'est juste une idée que j'ai eu en cours de math l'autre jour.

Une chose est sûre est que niveau place, ça doit être optimal.

Reply

Marsh Posté le 17-10-2001 à 21:34:46

c'est pas sur mais alors pas sur du tout que le resultat que tu vas obtenir sera moins gros à qualité egale.
Je m'explique :
l'oreille humaine est avant tout sensible aux differentes harmoniques dans le signal (les frequences) or avec l'iterpolation par polynome, tu va introduire des harmoniques inexistantes (qd tu va recoller les morceaux) et tu va en supprimer tout plein pq decomposer le signal avec une idtc c'est chercher des coefs pour un polynome dans l'espace des fonctions sin et cos or si toi tu limite le degré de ton polynome à 5 ou 6, ca va etre un peu pareil que si tu ne gardais que 5 ou 6 harmoniques avec l'idtc...

Quant au rez de neurones précité, ca pourrait marcher le seul probleme c'est la restitution (en gros, ce serait assez simple de creer un rez de neurones qui puisse dire si oui ou non, il a deja entendu la chanson auparavant par contre pour la memoriser, la taille doit etre assez importante et l'aprentissage assez long pour un morceau consequent)

Reply

Marsh Posté le 18-10-2001 à 19:33:24

c'est pour ça que je vais plutot me pencher vers la méthode du moindres carré de Gauss

Reply

Marsh Posté le 19-10-2001 à 05:29:16

kyle>j'ai de bonne notion sur les formats sonore (mp3, ogg, mod, xm, s3m, it ...), le mp3 utilise bien le FFT pour les models psychoacoustique. Sinon ton idée n'est pas tres claire, tu veux utiliser telle ou telle méthode, mais la compression implique que tu en utilises plusieurs : gauss et d'autres encore. Ce qui reviendra a refaire un format proche de ce que l'on connait.

Reply

idée de nouveau format son.... à méditer -> recherche codeur pour aide

Sujets relatifs:

Leave a Replay