Guillaume Brioudesdéveloppeur JavaScript

← Retour accueil

Regex : annuler les césures

J’ai récemment eu à effectuer des modifications massives dans des fichiers texte. Il s’agissait d’ouvrages OCR-isé dont la plupart des lignes se finissait par des césures (coupures de mots). Il a été décidé de les retirer.

-$\n([A-zÀ-ú,0-9]+) $1\n

L’expression régulière ci-dessus permet de combiner les mots coupés.

On décompose ainsi la formule :