J'aurai besoin d'aide pour l'analyse de fichiers fasta (sequence ADN). J'ai une centaine de fichiers fasta contenant chacun 600 sequences. Voila a quoi ressemble les fichiers:
J'aimerai calculer pour chaque fichier de 600 sequences le nombre de differences par pair de sequences. Par example, le nombre de difference entre 1-1-1 et 1-1-2 puis le nombre de difference entre 1-1-1 et 1-1-3, etc
A la fin, j'aimerai obtenir un fichier output qui me donne le nombre de pairs pour chaque nombre differences ainsi que le pourcentage. Par example:Nombre de Difference Nombre de pairs Pourcentage 1 25 2% 2 50 4% ... .... ....
Cependant je n'arrive pas a faire un script qui fonctionne et je ne vois vraiment pas comment obtenir le tableau que je veux. Si quelqu'un pouvait m'aider ou avait des suggestions a me proposer, j'en serai tres heureuse car je suis vraiment perdue.
Marsh Posté le 16-01-2019 à 10:33:47
Bonjour,
J'aurai besoin d'aide pour l'analyse de fichiers fasta (sequence ADN).
J'ai une centaine de fichiers fasta contenant chacun 600 sequences.
Voila a quoi ressemble les fichiers:
>1-1-1
CAACCCACAAAAACCCAACACAACAAAACCAACCCAACCAACCCCCCAACACACCCAAAACACACACAACCCAACAAACCACAAAACCAAACAACCCAACACACAACACCCCACCAACCAACAACACCCAAACCAACCCAAAACAAAACCACCACCACCACCCCACACAAAACCAAACCCACC
>1-1-2
CAACCCACAAAAACCCAACAAAACAAACCCCACCCAACCAACCCCCCACCACACCCAAAACACACACAACCCAACAAACCACAAAACCAAACAAACCAACACACAACACCCAACCAACCAACAACACCCAAACCAACCCAAAACAAAACCACCACCACCACCCCACACAAAACCAAACCCACC
>1-1-3
AAACCCACAAAAACCCAACACAACACAACCACCACAACCAACCCCCCCCCACACCCAAAACACACCCAAAACAACAAACCACAACACCAAACAAACCAAAACACAACACCCCCCCAACCAACACCACCAAAACCAACCCAAAACAACCCCACCACCACCACCCCAAACAAAACCACACCCACC
>1-1-4
CAACCCACAAAAACCCAACACAACAAAACCAACCCAACCAACCCCCCAACACACCCAAAACACACACAACCCAACAAACCACAAAACCACACAACCCAACACACAACACCCCACCAACCAACAACACCCAAACCAACCCAAAACAAAACCACCACCACCACCCCACACAAAACCAAACCCACC
J'aimerai calculer pour chaque fichier de 600 sequences le nombre de differences par pair de sequences.
Par example, le nombre de difference entre 1-1-1 et 1-1-2 puis le nombre de difference entre 1-1-1 et 1-1-3, etc
A la fin, j'aimerai obtenir un fichier output qui me donne le nombre de pairs pour chaque nombre differences ainsi que le pourcentage.
Par example:Nombre de Difference Nombre de pairs Pourcentage
1 25 2%
2 50 4%
... .... ....
Voila le script que j'ai ecrit:
Cependant je n'arrive pas a faire un script qui fonctionne et je ne vois vraiment pas comment obtenir le tableau que je veux.
Si quelqu'un pouvait m'aider ou avait des suggestions a me proposer, j'en serai tres heureuse car je suis vraiment perdue.
Merci d'avance