Tout savoir sur BDoubliees : Vérification d'une description
Cette page vous explique comment sont vérifiées les descriptions des
numéros d'une revue.
Généralités sur les vérifications
La description d'une revue doit être homogène avec les descriptions des autres
revues. Quand des auteurs qui ont travaillé dans d'autres revues sont cités,
leur nom doit être écrit exactement de la même façon. C'est la même chose
pour les noms de séries. De nombreux autres contrôles sont à réaliser
pour la cohérence du tout avant la génération et l'officialisation des
pages de la revue sur le site.
Ce sont tous ces contrôles qui vont être détaillés dans cette page.
Les contrôles sont faits par un programme. Ils peuvent nécessiter un
traitement manuel et des vérifications pour corriger les erreurs détectées.
Vérifications effectuées
Présentation
Le programme de vérification d'un fichier de description de numéros d'une
revue se nomme "verification_description". Il a deux paramètres :
- Le nom du répertoire de la revue
- Le nom du fichier contenant les descriptions
Le programme de vérification génère trois choses :
- un fichier bilan des défauts rencontrés
- un programme pour la correction automatique des défauts
- un fichier propositions contenant des propositions pour corriger certains défauts
Vérifications effectuées par le programme
Mélange de numéros
Dans un premier temps, le programme vérifie qu'il n'y a pas de mélanges dans
les numéros de revues. Chaque ligne du fichier décrivant les numéros d'une revue
débute par le numéro interne de la revue. Si, plusieurs numéros sont mélangés
dans une même revue, c'est une erreur. Cela ne peut pas se produire si la description
a été faite avec la page "description_revue.htm", mais elle peut arriver avec les
descriptions faites sous Excel ou avec un traitement de texte. Elle peut
également se produire si on modifie le fichier produit par "description_revue"
par exemple pour ajouter une information par copier/coller.
Ce défaut est signalé dans le fichier bilan.
Types d'informations inconnus
Le programme vérifie que tous les types d'informations indiqués sont
connus. Si ce n'est pas le cas, il indique dans le fichier bilan quelles
lignes contiennent des types d'information inconnus.
Si les noms sont simplement dus à une faute de frappe, il indique dans
le fichier propositions quelles lignes sont concernées et quelles modifications
sont proposées.
Noms de série inconnus
Tous les noms de série utilisés dans les descriptions sont vérifiés. S'ils ne
sont pas déjà connus dans d'autres revues, le programme indique dans le fichier
bilan les noms de série inconnus et le numéro de ligne où ils sont
utilisés. Le programme mémorise ces noms des séries inconnues.
Noms d'auteur inconnus
Le traitement est identique à celui des séries inconnues.
Séries qui n'en sont pas
Pour toutes les séries inconnues, le programme vérifie qu'elles sont utilisées
au moins deux fois dans les descriptions. Si ce n'est pas le cas, il met
dans dans le programme pour la correction des défauts des instructions
pour transformer la série en titre.
Titres qui sont des séries
Si plusieurs descriptions n'ont pas de nom de série et contiennent le même
titre, alors c'est que le titre devrait être un nom de série. Dans ce
cas, le programme de vérification met dans le programme pour la correction
des défauts des instructions pour transformer le titre en série.
Recherche des fautes de frappe sur les noms de série
Pour chacune des séries qui sont inconnues, le programme recherche s'il existe
des noms de série similaires (recherche phonétique). S'il y en a, dans le fichier
propositions, il propose de renommer les noms de série concernés.
Recherche des fautes de frappe sur les noms d'auteurs
Le même traitement est fait sur les noms d'auteurs.
Inversion nom et prénom pour les auteurs
Le programme regarde si les auteurs inconnus avec "Nom Prénom" ne sont pas
décrits sous la forme "Prénom Nom". Si c'est le cas, il propose de renommer
"Prénom Nom" en "Nom Prénom".
Absence de prénom
Si un des auteurs inconnus est connu dans d'autres revues avec un prénom,
Le programme indique les prénoms possibles et dans quelles revues ils sont
utilisés et quelles années. Il génère dans le fichier propositions
les instructions permettant de
renommer les auteurs avec le prénom qui convient.
Prénom pour un auteur qui n'en avait pas
Si un auteur inconnu avec prénom est connu dans d'autres revues mais sans prénom,
le programme indique dans quelles revues et quelles années l'auteur aparaissait.
Il génère également dans le fichier propositions les instructions permettant
d'ajouter le prénom à l'auteur dans toutes les autres revues où il est utilisé.
Auteurs et séries inconnus
Pour chaque auteur ou série inconnu où il n'y a pas de proposition
de renommage, le programme ajoute dans le programme de correction des
défauts les instructions permettant de définir les nouveaux pseudonymes.
Il génère également dans le fichier propositions
les instructions à utiliser si aucun renommage ne convient et qu'il faut créer
les pseudonymes.
Vérification des bd et romans à suivre
Le programme vérifie que toutes les histoires à suivre (BD et romans) ont un
début et une fin. Il faut le même titre et les mêmes auteurs pour le début
et la fin.
Les erreurs sont signalées dans le fichier bilan.
Correction des erreurs détectées par le programme de vérification
Sauvegarde du fichier de description
Avant de faire des modifications dans le fichier de description des numéros
de la revue, on réalise une sauvegarde de ce fichier pour avoir une référence
en cas d'erreur dans une correction.
Correction des erreurs signalées dans le fichier bilan
Trois types d'erreurs à corriger manuellement sont signalées dans le
fichier bilan :
- Erreur de numérotation dans un numéro de revue :
on peut soit enlever la ligne en erreur (copie non justifiée), soit la
renuméroter correctement (copie en ayant oublié de changer le numéro), soit
la déplacer.
- Type d'information inconnu : il ne faut pas créer un nouveau type d'information
mais choisir parmi ceux qui existent celui qui convient le mieux.
- Erreur dans une histoire à suivre : il peut s'agir d'un oubli du début ou
de la fin et dans ce cas, il faut reprendre les revues pour trouver ce début
ou cette fin. Il peut s'agir d'une faute de frappe dans le titre et il faut la
corriger. Il peut s'agir d'une erreur dans les auteurs qui est également
à corriger.
Correction des erreurs signalées dans le fichier propositions
Pour les pseudonymes d'auteurs ou de séries inconnus mais proches de
pseudonymes qui existent dans d'autres revues, le fichier propose :
- soit de renommer le pseudonyme dans le fichier et propose plusieurs
psuedonymes possibles. Pour chacun d'eux il indique dans quelle revue et
en quelle année il est utilisé,
- soit de renommer le pseudonymes dans toutes les autres revues car le
nom indiqué est plus correct que celui qui était connu
- soit de créer un nouveau pseudonyme et un nouveau pseudonyme principal
Le choix effectué est à reporter dans le programme de correction des défauts.
Corrections avec le programme de correction des défauts
Avant d'être activé, ce programme doit être examiné pour vérifier que
ce qui est proposé convient. On peut découvrir, par exemple, qu'une faute
de frappe n'a pas été détectée et qu'il faut remplacer la création d'un
nouveau pseudonyme par un simple renommage. On peut découvrir
que plusieurs pseudonymes qui vont être ajoutés sont le même nom
mais écrit de façons différentes. Dans ce cas, il faut créer un seul pseudonyme
et renommer les autres.
Quand la vérification est terminée, on peut exécuter le programme de correction
des défauts.
Ensuite, on relance le programme de vérification pour être certain que tous
le défauts ont été corrigés. Si ce n'est pas le cas (certaines corrections
peuvent provoquer d'autres défauts), alors il faut relancer le processus
de vérification et de correction.
Validation des modifications par l'auteur des descriptions
Un programme nommé "recherche_differences" recherche tout ce qui a été modifié
entre le fichier de description initiale et le fichier corrigé. Il génère une
page avec toutes les descriptions. Celles où il y a eu des modification sont
affichées en double avec l'ancienne et la nouvelle version. Les changements
sont surlignés en jaune.
L'auteur des descriptions peut ainsi valider les modifications effectuées.