<mavie>
Je suis un informaticien, compagnon d'une universitaire qui est en train de publier avec des collègues une somme sur un auteur ancien.
</mavie>
Je voudrais l'aider à générer les références de l'index de l'ouvrage. Ça représente un certain volume de texte (on parle de 6 volumes d'environ 1000 pages chacun), et l'index contient environ 3400 entrées …
Bien entendu, ce sont des littéraires, la mise en page finale est en cours et je n'ai que les pdf des tirages finaux pour composer les liens (oui ça aurait été bien plus facile avec du latex et les balises \index mais la moyenne d'âge des co-éditeurs frise les 65 ans).
Je me dis que ce problème à du être rencontré un peu partout dans le monde universitaire et peut être que je suis passé à côté d'un projet Européen ou autre qui pourrait nous aider à faire ça "plus facilement".
J'ai commencé quelque chose de mon côté, avec l'aide des IAs (je me dis que c'est un bon projet perso pour confirmer ce que je pense (ou pas) du code construit par les IA (ça fera l'objet d'un autre journal si j'aboutis à quelque chose)).
Le principe serait de permettre la description de l'index via une interface web (plus simple pour des néophytes ?), puis la génération du document d'index final.
Je pensais que ça serait simple, mais en fait c'est bien plus complexe que ce qu'il n'y parait. Par exemple comment trouver les noms des gens présents dans l'index, lorsque deux noms de famille identiques sont présents, comment gérer les références dans l'index (les "see also"), comment gérer les titres sur de la concordance (matching) multi-ligne, etc … Sans compter le côté humain de l'index actuel (comprendre avec des erreurs, le formatage est un peu aléatoire, etc …)
Bref c'est une tâche bien plus importante que mon idée de départ, alors je fais appel à ceux qui savent / ont déjà fait ça : comment avez-vous fait ?
(la réponse "c'est l'éditeur qui a pris ça en charge me va", mais dans leur cas, c'est niet, les universités de Princenton leurs ont dit débrouillez-vous).