Files

2025-11-06 22:34:21 +01:00

10 KiB

Raw Blame History

Résumé du Projet - Anagram Generator

Vue d'ensemble

Un générateur d'anagrammes prononçables en Rust, conçu selon les principes SOLID et Clean Code, avec une architecture modulaire et testable.

Structure du projet

anagram-generator/
├── Cargo.toml                      # Configuration Cargo et dépendances
├── README.md                       # Documentation utilisateur
├── ARCHITECTURE.md                 # Documentation de l'architecture (principes SOLID)
├── TESTING.md                      # Guide de tests
├── LETTER_REMOVAL_FEATURE.md       # Documentation de la fonctionnalité de retrait de lettres
├── PROJECT_SUMMARY.md              # Ce fichier
│
├── src/                            # Code source de la bibliothèque
│   ├── lib.rs                     # Point d'entrée de la bibliothèque
│   ├── main.rs                    # Application CLI
│   ├── types.rs                   # Types de domaine (Anagram, PronouncabilityScore)
│   ├── scorer.rs                  # Traits et configurations pour le scoring
│   ├── analyzer.rs                # Implémentation de l'analyse phonétique
│   ├── generator.rs               # Générateur d'anagrammes + retrait de lettres
│   └── error.rs                   # Gestion des erreurs
│
└── tests/                          # Tests d'intégration
    ├── analyzer_tests.rs           # Tests pour l'analyseur (11 tests)
    ├── generator_tests.rs          # Tests pour le générateur (9 tests)
    ├── types_tests.rs              # Tests pour les types (10 tests)
    ├── letter_removal_tests.rs     # Tests pour le retrait de lettres (10 tests)
    └── integration_tests.rs        # Tests end-to-end (6 tests)

Architecture technique

Principes SOLID appliqués

Single Responsibility Principle (SRP)
- Chaque module a une responsabilité unique
- Séparation claire : types, scoring, analyse, génération, erreurs
Open/Closed Principle (OCP)
- Extensible via le trait PronounceabilityScorer
- Fermé à la modification, ouvert à l'extension
Liskov Substitution Principle (LSP)
- Toute implémentation de PronounceabilityScorer est interchangeable
- Injection de dépendances via génériques
Interface Segregation Principle (ISP)
- Traits focalisés et minimalistes
- Une seule méthode par trait principal
Dependency Inversion Principle (DIP)
- Dépendance sur des abstractions (traits)
- Injection de dépendances dans AnagramGenerator et App

Patterns de conception

Value Object : PronouncabilityScore, Anagram
Strategy : PronounceabilityScorer trait
Builder : GenerationConfig::default().with_*(...)
Dependency Injection : Constructeurs acceptant des traits

Clean Code

Noms expressifs et descriptifs
Fonctions courtes et focalisées
Pas de nombres magiques (configuration explicite)
Immuabilité par défaut
Gestion d'erreurs explicite
Tests complets et documentés

Modules principaux

types.rs

Types de domaine immuables et type-safe :

PronouncabilityScore : Score de prononçabilité (0-100)
Anagram : Représente un anagramme avec son score

scorer.rs

Définit l'abstraction du scoring :

Trait PronounceabilityScorer
CharacterClassifier : Classification voyelles/consonnes
ConsonantClusterRules : Règles pour les clusters communs
ScoringPenalties : Configuration des pénalités
PatternAnalysisConfig : Configuration de l'analyse

analyzer.rs

Implémentation de l'analyse phonétique :

PronounceabilityAnalyzer : Analyse basée sur des patterns
Détection de consonnes/voyelles consécutives
Reconnaissance de clusters communs (th, st, br, etc.)
Calcul de score avec pénalités et bonus

generator.rs

Génération d'anagrammes :

AnagramGenerator<R, S> : Générateur générique
GenerationConfig : Configuration avec builder pattern
LetterRemovalStrategy : Stratégie de retrait de lettres (None ou Adaptive)
Génération aléatoire avec shuffle
Nouveau : Retrait adaptatif de lettres pour maximiser la prononçabilité
Filtrage par score minimum
Élimination des doublons

error.rs

Gestion des erreurs :

AnagramError : Enum pour les erreurs métier
Implémentation de std::error::Error
Messages d'erreur descriptifs

main.rs

Application CLI :

Parsing d'arguments avec clap
Structure App<S> avec injection de dépendances
Séparation présentation/logique

Fonctionnalités

Pour l'utilisateur

# Générer 10 anagrammes
cargo run -- --word "exemple" --count 10

# Anagrammes très prononçables (score ≥ 70)
cargo run -- --word "pseudo" --count 15 --min-score 70

# Plus de tentatives pour mots difficiles
cargo run -- --word "rhythm" --count 5 --min-score 40 --max-attempts 5000

# NOUVEAU : Autoriser le retrait de lettres
cargo run -- --word "strength" --count 10 --min-score 60 --remove-letters 3

Options CLI

--word / -w : Mot source (optionnel - si absent, génère des mots aléatoires)
--count / -c : Nombre d'anagrammes (défaut: 10)
--length / -l : Longueur des mots aléatoires (défaut: 6)
--prefix / -p : Préfixe pour les mots aléatoires (optionnel)
--min-score / -s : Score minimum 0-100 (défaut: 50)
--max-attempts / -a : Tentatives max (défaut: 1000)
--remove-letters / -r : Retirer jusqu'à N lettres pour maximiser la prononçabilité
--add-vowels : Ajouter jusqu'à N voyelles pour maximiser la prononçabilité
--add-letters : Ajouter jusqu'à N lettres communes pour maximiser la prononçabilité

Fonctionnalité de génération aléatoire avec préfixe

Nouveau : Génère des mots prononçables aléatoires avec un préfixe imposé.

Exemple :

# Générer des mots commençant par "test"
cargo run -- --count 10 --length 7 --min-score 60 --prefix "test"
# Résultat: testoxo, testaan, testaer, etc.

# Générer des pseudonymes commençant par "jo"
cargo run -- --count 10 --length 6 --min-score 70 --prefix "jo"
# Résultat: jobeuw, jowung, jokeim, etc.

Fonctionnement :

Le générateur commence par le préfixe spécifié
Détecte si le dernier caractère du préfixe est une voyelle ou consonne
Continue l'alternance intelligente voyelle/consonne pour compléter le mot

Fonctionnalité de retrait de lettres

Permet de générer des pseudonymes plus prononçables en retirant stratégiquement des lettres.

Exemple :

Sans retrait : strength → aucun anagramme avec score ≥ 60
Avec retrait : strength --remove-letters 2 → "thsetr", "rtethg", "trgent", etc.

Voir LETTER_REMOVAL_FEATURE.md pour la documentation complète.

Tests

Statistiques

46 tests au total (+10 pour le retrait de lettres)
100% de réussite
Couverture : ~90%
Temps d'exécution : < 10s

Organisation

Tests unitaires par module dans tests/
Tests d'intégration end-to-end
Tests avec seeds fixes pour reproductibilité
Tests de cas limites et d'erreurs

Exécution

cargo test                          # Tous les tests
cargo test --test analyzer_tests   # Tests spécifiques
cargo test -- --nocapture           # Avec sortie

Dépendances

Production

clap (4.5) : Parsing d'arguments CLI avec derive
rand (0.8) : Génération aléatoire pour shuffle

Développement

Tests intégrés (pas de dépendances externes)
Documentation inline

Métriques de qualité

Métrique	Valeur
Lignes de code (src)	~700
Lignes de tests	~500
Modules	7
Tests	36
Complexité cyclomatique	< 10/fonction
Couplage	Faible
Cohésion	Forte

Extensibilité

Ajouter un nouveau scorer

// Nouveau module: ml_scorer.rs
pub struct MLScorer {
    model: Model,
}

impl PronounceabilityScorer for MLScorer {
    fn score(&self, text: &str) -> PronouncabilityScore {
        let prediction = self.model.predict(text);
        PronouncabilityScore::new(prediction as u32)
    }
}

// Utilisation
let scorer = MLScorer::load("model.bin");
let mut generator = AnagramGenerator::new(rng, scorer);

Ajouter de nouvelles règles phonétiques

// Étendre ScoringPenalties
let penalties = ScoringPenalties {
    three_or_more_consecutive_consonants: 30,
    // ... autres pénalités personnalisées
};

let analyzer = PronounceabilityAnalyzer::new(
    classifier,
    cluster_rules,
    penalties,
    config
);

Performance

Génération rapide (< 100ms pour 10 anagrammes)
Zero-cost abstractions (traits compilés)
Pas d'allocations inutiles
HashSet pour unicité en O(1)

Sécurité

Pas d'unsafe code
Validation des entrées
Clamping des scores (0-100)
Gestion d'erreurs explicite
Pas de panic en production

Documentation

Pour les utilisateurs

README.md : Guide d'utilisation
Help intégré : cargo run -- --help

Pour les développeurs

ARCHITECTURE.md : Principes SOLID et architecture
TESTING.md : Guide de tests
PROJECT_SUMMARY.md : Vue d'ensemble
Documentation inline dans le code

Commandes utiles

# Développement
cargo build                 # Compilation
cargo build --release       # Optimisée
cargo run -- --word test    # Exécution
cargo test                  # Tests
cargo doc --open            # Documentation

# Qualité
cargo clippy                # Linter
cargo fmt                   # Formatage
cargo check                 # Vérification rapide

# Release
cargo build --release
./target/release/anagram-generator --word example --count 10

Améliorations futures possibles

Fonctionnalités
- Support multi-langues (anglais, espagnol, etc.)
- Export des résultats (JSON, CSV)
- Mode interactif
- API REST
Performance
- Cache des scores calculés
- Parallélisation avec rayon
- Optimisation des allocations
Qualité
- Property-based testing avec proptest
- Fuzzing
- Benchmarks avec criterion
Distribution
- Binaires pré-compilés
- Docker image
- Publication sur crates.io

Licence

MIT

Auteur

Rawleenc

Conclusion

Ce projet démontre une application professionnelle des principes de génie logiciel :

Architecture SOLID
Clean Code
Tests complets
Documentation exhaustive
Extensibilité
Performance

Le code est maintenable, testable, et prêt pour la production.

10 KiB Raw Blame History