Le scarabée répétophobe
Détecteur de répétitions
Travaux en cours
Il n'y a pas longtemps, je suis tombé sur un répétoscope, dont le principe était tout simple : vous lui proposez un texte, et il vous affiche le "hit-parade" des mots que vous avez le plus utilisé dans ledit texte !
J'étais tout d'abord émerveillé, puis, plus je tâtais de la bête, plus j'étais déçu et trouvais que ce "répétoscope" ne faisait pas le vrai boulot qu'on lui demandait, c'est-à-dire : détecter les répétitions.
Par exemple, si vous utilisez trois fois le mot "plus" dans la même phrase, il ne détectera pas forcément cette odieuse répétition, car il s'est uniquement intéressé aux mots qui sont globalement le plus souvent répété.
Totalement indigné par cette escroquerie, j'ai décidé de créer mon propre répétoscope, que j'ai nommé : le Scarabée répétophobe !
(Pourquoi un scarabée ? me direz-vous. Tout simplement parce que ce noble animal, à l'instar de la mouche, a pour habitude de "fouiller dans la merde")
Non content de proposer la même "hit-parade" de vocabulaire, le scarabée répétophobe dispose en plus d'un vrai détecteur de répétitions, qui indique quand le même mot est utilisé plusieurs fois à de courtes reprises.
Bien que ça ne puisse totalement remplacer une méticuleuse relecture humaine, c'est un outil fort pratique pour corriger son texte avant de le publier, que ce soit un article de T&tra, un roman en cours d'écriture, ou une nouvelle trépidante.
Cependant, attention : comme tout outil, il faut savoir l'utiliser. Voici donc un petit guide d'utilisation du Scarabée répétophobe.
I - Sélectionner des mots ou des répétitions
Une fois que vous aurez analysé votre texte, vous disposerez de deux tables : la table des répétitions, et la table des mots. La première indique l'ensemble des répétitions proches qui ont été détectées, et est triée par ordre d'apparition. La deuxième indique l'ensemble des mots qui apparaissent plus de trois fois, et est triée par nombre d’occurrences.
Faire un clic gauche sélectionne la ligne visée.
Faire un clic gauche en maintenant alt permet de sélectionner plusieurs lignes.
Faire un clic gauche en maintenant shift permet de sélectionner une plage de lignes.
II - Accéder à une répétition
Cliquer sur un des mots de la table de répétition, amène directement à la première occurrence de cette répétition.
III - Valider une répétition
Beaucoup de répétitions détectées par le scarabée sont "normales" et n'ont pas lieu d'être remplacées. Afin d'aider à détecter les "mauvais répétitions", il est possible de double-cliquer sur une ligne afin de la faire changer de couleur. Cela permet, lors de l'analyse d'un texte, de séparer le bon grain de l'ivraie.
IV - Sauvegarder son travail
Séparer les bonnes répétitions des mauvaises peut s'avérer assez long. Fort heureusement, le Scarabée sauvegarde automatiquement le travail effectué. Vous pouvez fermer quand vous le désirer, lorsque vous rouvrirez la page, vous reviendrez là où vous en étiez.
V - Taille maximale d'un texte
Il n'y a pas de limites à la taille maximale d'un texte.
VI - Options
Il est possible de modifier la longueur minimale des mots qui seront traités, d'ajouter des exceptions au mot qui seront traité, et de modifier la finesse de l'analyse.
Plus la finesse de l'analyse est basse, plus l'algorithme sera laxiste quant à la distance maximale qui peut séparer deux répétitions. La proximité d'un groupe de répétitions est évaluée par la colonne "Poids" de la table de répétitions. Si la finesse de l'analyse est posée à 76, alors les répétitions dont le poids est inférieur à 76 ne seront pas prises en compte.
VII - Limites du scarabée
Le scarabée ne considérera pas : "Tu m'avais promis une promesse" comme une répétition. Il ne s'intéresse qu'aux mots strictement identiques, c'est pourquoi une relecture humaine reste indispensable.
Et voili voilou, je pense que j'ai tout dit.
Comme c'est une première version, il peut y avoir des bugs (il y en aura même sûrement). Si vous en trouvez, je serai ravi que vous me les reportiez :)
00:05 - 25 févr. 2016
Ok ! Je viens de tester en conditions réelles.
C'est merveilleux !
Les quelques lacunes sont vites balayées avec un ctrl+F complémentaire.
quelques petites remarques quant à l'ergonomie générale :
Il manque peut-être une petite flèche en bas de page pour revenir rapidement vers le haut (sinon en fonction du calibre des pages, ça peut vite faire de très longs scroll up).
Pour l'encadré du texte : un bouton effacer (pour vider le texte) serait pas de refus => en fait je me suis aperçu que corrige directement le texte dans le traitement de texte (en retrouvant les itérations par un ctrl+f) et que je le remets régulièrement dans le scarabée pour vérifier les modifications au fur et à mesure (d'où pas mal de ctrl+a / ctrl+c / ctrl+v)
En tout cas, c'est vraiment du très très bon boulot et j'ai l'impression que je vais enfin me tirer d'affaire avec ma maudite tendance à la répétition :)
Tu penses pouvoir développer un autre outil pour les corrections d'accords d'auxiliaires :D
"J'ai une âme solitaire"
00:11 - 25 févr. 2016
Je suis prêt à servir de conseil pour cet outil de correction d'auxiliaires si tu le développes ! ! >.>
21:15 - 25 févr. 2016
Je suis content que ça te plaise :) Je vais ajouter un bouton pour clear la zone principale, et peut-être un truc en plus.
Un bouton pour revenir en haut, pourquoi pas aussi, c'est tout simple à faire. Sinon dans "Plus d'options", tu peux baisser le nombre de mots par page, afin de ne jamais avoir à faire de trop longs scrollings (à 500 mots tu n'as presque pas de scrolling).
Quant à un outil pour les corrections d'accords d'auxiliaires oO Déjà je suis pas sûr moi-même de bien connaître toutes les règles, il faudrait commencer par là. Et ensuite je pense que l'algorithme serait d'une effroyable complexité ^^ Je n'ai pas trop envie de me casser la tête là-dessus pendant des semaines.
Mais un jour, pourquoi pas ! Avec l'aide de Chikoun, ça pourrait se faire.
21:24 - 25 févr. 2016
En vrai, ca me parait assez compliqué. Plus à détecter qu'à corriger. Je veux dire, on peut difficilement faire la liste de tous les féminins de la langue francaise (où il est plus facile de déterminer les marques du pluriel). Un correcteur, je ne sais pas... Un détecteur, c'est une possibilité, par contre. Détecter tous les participes pour avoir la possibilité de les revoir manuellement ensuite, avec les règles expliquées à côté, histoire de ne jamais en louper, pourquoi pas? C'est à mi chemin entre la correction auto et la relecture manuelle, et surement beaucoup plus simple que de directement proposer la bonne réponse. Je sais pas, une idée en l'air :D
08:27 - 26 févr. 2016
Je plussoie Lep pour l'effroyable complexité.
Et Chik pour la solution en compromis.
20:48 - 2 mars 2016
Hop, le petit update a été fait :
- deux boutons "clear" ont été ajoutés, un sur la zone de texte et un sur l'aperçu. Le bouton sur la zone de texte supprime toutes les données courantes.
- un bouton en bas des pages pour revenir tout en haut a été ajouté
- désormais, lorsque l'on clique sur une répétition, la première occurence sera automatiquement sélectionnée dans la zone d'édition de texte, afin d'aider ceux qui travaillent directement sur celle-ci.
(pour ceux qui ne voient pas les boutons, actualisez la page)
18:55 - 29 mai 2016
Problème que tu n'aurais pas si tu passais par des lemmes.
A voir dans ce cadre, l'utilisation du Wordnet Ouvert Libre Français avec python/nltk.
Joli performance, autrement !
10:05 - 5 juin 2016
Le but premier du repetoscope est sans doute moins de détecter des "répétitions" (entendues comme des fautes de style) que d'informer sur les récurrences lexicales et thématiques, ce qui en fait un outil utile pour l'analyse de texte. Je ne le connais pas spécialement, j'utilise d'autres softs, donc je ne suis pas le mieux placé pour en parler. Tropes permet de faire les deux, et il repère les cas de dérivation (promis/promesse pour reprendre ton exemple). Il a été conçu par des universitaires et il est gratuit ; il est peut-être un peu plus complexe à utiliser en revanche, je le signale sans qu'il ait vocation à se substituer à la belle machine infernale de Lepz.
14:56 - 11 août 2016
Olala, j'avais pas vu ton repetoscope, il est top !
Merci Lepz, c'est vraiment du beau travail :)