Première page Précédent Suivant Dernière page Résumé Image
Approche théorique
- Obtenir la plus longue série de bases alignées est équivalent à obtenir le plus grand nombre de fois face consécutivement (Z(N)) dans une séquence de tirages indépendants d'une pièce avec la probabilité P d'obtenir face (Gordon 1986, Karlin 1988)
- La distribution de Z(N) peut-être approximée par
- avec et W variable aléatoire décrivant le tirage.
- D'où :
- Valeur de k nécessaire pour détecter les régions présentant une similitude de longueur N avec P % d'identité à un risque :
- Proportion de régions de longueur N avec P % identité ne contenant pas une graine de longueur k fixée :
- Les approximations faîtes s'appliquent quand N tend vers l'infini.