Comment faire un article de 200 pages de long ?

"Comment faire un article de 200 pages de long ?" Voilà une question que tu ne t'étais jamais posé, et à laquelle j'ai la possibilité d'apporter des éléments de réponses. Parce que oui, j'ai un papier qui fait maintenant 198 pages de long, mais on va arrondir, ce n'est pas comme si j'étais certain que deux pages supplémentaires ne pousseront pas.

Entendons nous bien d'abord sur l'énoncé du problème. Il ne s'agit pas de faire un livre, un recueil, un manuscrit, un cours. Il s'agit juste de faire un article, c'est à dire un texte qui présente entre un et quatre résultats principaux, disons, tous relié entre eux de manière forte.

D'abord, pour faire un article aussi long, il faut prévoir plusieurs années. Tu ne peux pas espérer faire un article de 200 pages en 3 mois. Même en un an, c'est compliqué. Il faut laisser le temps à l'article de pousser.

Je vais commencer par les astuces les plus classique : la mise en page. Évitez le pacquage fullpage, qui met autant de texte que possible par page. Ici, ça réduit l'article à 172 pages. On peut même garder le format par défaut de LaTeX, le format letter (dans ce cas, je pars sur du 213 pages, mais je trouve ça exagéré).

En fait, toutes les autres astuces de mise en pages que je pourrai vous donner son ridicules, parce qu'elles ne font gagner que quelques pages à chaque fois. Par exemple, utiliser des chapitres au lieu d'utiliser des parties, ce qui vous offre un saut de page, ça fait gagner environ une demi-page par chapitre. Ici j'ai 7 chapitres, ce n'est pas trois pages et demi qui me permettront d'atteindre les 200 pages. En plus, ça veut dire que vous aurez beau rajouter quelques lignes par-ci par-là paragraphe, si ce n'est pas absorbé par la mise en page de LaTeX qui évite que les paragraphes s'étendent sur plusieurs pages, alors ça poussera la fin du chapitre de quelques lignes vers le bas, mais ne poussera pas le chapitre suivant une page plus loin.

Quelques autres petites pages à gagner: avoir une table des matières, avec chapitre, section, sous-sections et sous-sous-section. Là je gagne 3 pages. Plus une page pour la table des matières des figures. Avoir un index, c'est bien aussi. Mais il faut du courage, car pour faire 3 pages d'index, il faut penser, régulièrement, à taper \index quand on introduit des nouvelles notations. En ayant un index à deux colonne, pour faire 3 pages, je parle ici de 238 éléments indexés !


Passons aux choses sérieuse, ce qui fait le gros des 200 pages.

Déjà, ne présentez pas qu'un seul résultat, mais présentez plusieurs variantes. Ainsi, un résultat qui s'applique à 10 cas différent, c'est bien. Si en plus il y a des subtiles différences selon chaque cas, c'est mieux. Ainsi, on peut souvent dire dans les lemmes "dans les 5 premiers cas, la preuve est ceci... sinon il suffit de rajouter l'hypothèse que truc, et se rapporter aux premiers cas". Mais en général, il faudra dire plutôt "dans les cas 1, 4 et 5, ceci, sinon cela", ça permet de faire une petite énumération. Surtout si au lieu d'être numéroté, les cas ont des noms, ça prend plus de place (mais il faut avouer, que c'est aussi plus compréhensible si les noms sont parlants.) Le mieux étant quand même quand au lieu de faire une disjonction de cas dans un lemme, on peut faire une section pour un cas, et une autre pour l'autre cas. Attention cependant, il faut que ces sections soient petite par rapport à la taille du papier, sinon ça devient deux papiers distincts ! Ici, 15 pages en plus pour traiter trois cas particulier, c'est à peu près raisonnable au vu de la taille du papier. Il ne faut cependant pas oublier que, 15 pages, en vrai, c'est la taille d'un grand papier de conférence.

La règle précédente peut se reformuler en: généraliser vos résultats autant que possible. Ainsi, pourquoi travailler sur les entiers naturels si on peut travailler sur les relatifs ? Réduire le cas des entiers relatifs vers les naturels me prend dix pages, et hop, déjà 5% de mon papier. Pour justifier de ne pas regarder que les naturels, c'est pratique si la réduction des relatifs vers les naturels te pousse à considérer un problème plus général que le problème que tu aurais intuitivement voulu résoudre sur les naturels.

Tu peux aussi prouver un résultat. Puis partir de ce résultat pour en prouver un autre. Et ainsi de suite. Tout ces résultats n'ont pas forcément grand chose à voir entre eux, il faut simplement que tout les résultats intermédiaires servent à prouver le résultat final et prétendre que ce qui t'intéresse est le résultat final.

Une autre règle pratique est d'utiliser pleins d'outils mathématiques différents. Comme il faut introduire tous les objets mathématiques que tu utilises, tu peux gagner 7 autres pages en disant tout ce qu'il faut savoir sur les automates, les monoide, l'écriture d'un nombre dans une base, les graphes, la logique, et le temps de calcul. Ceci dit, il faut admettre que cette règle n'avait pas vraiment besoin d'être énoncé, quand un papier fait 200 pages, il arrive assez rapidement que plein de domaines soit utilisés.

Toutes ces règles poussent à en considérer une autre : ne pas être avare sur les exemples. Si on a suivi les règles précédentes, il y a plein de cas différents considéré. À chaque fois qu'un exemple arrive naturellement, on peut à la place mettre plusieurs exemples pour illustrer les petites nuances selon le cas considérés. Bien sûr, l'exemple doit surtout montrer la ressemblance entre ces différents cas, sans ces ressemblance, on ne pourrait pas justifier de traiter tous les cas à la fois.


Fini de jouer, il reste encore plus d'une centaine de page à créer, et là, on a fini le tour des trucs simples.

Le VRAI truc, c'est d'utiliser des objets compliqués. Pas compliqué théoriquement, ni au sens informatique. Ainsi, l'objet principal dont mes preuves se servent est un quadruplet, composé d'un entier, un uplet d'entier, un vecteur et une matrice. Informatiquement, c'est très simple de représenter tout ça, un quadruplet c'est juste un type produit. Un uplet d'entier, c'est juste un tableau. Un mathématicien n'aura, en général, pas de mal à comprendre ce qu'est un quadruplet. C'est juste compliqué parce que, à chaque fois que tu dois prouver que deux éléments sont égaux, il faut prouver 4 égalités. En pratique, beaucoup de ces égalités sont triviales à prouver, donc tu ne gagnes pas beaucoup de pages comme ça, mais a fait toujours quelques lignes en plus par-ci par-là. Mais si en plus tu veux faire un ordre lexicographique sur le quadruplet, là tu gagnes beaucoup de pages, à considérer les cas selon quel est la première des 4 positions qui est plus petite dans un quadruplet que dans l'autre.

Le dernier point, je suis forcé d'imaginer, en vrai, j'ai des ordres plus compliqués que l'ordre lexicographique. Et surtout, j'ai des relations d'ordre, des relations d'ordres sur ces relations d'ordre, et même un lemme qui ordonne les relations d'ordre sur les relations d'ordre. Donc dans tous les textes où je parle d'ordre, je suis forcé de préciser l'ordre considéré. Dire "le plus grand élément selon <" ou "une L-section commençante[1]", c'est toujours quelques symboles de gagner. Ça ne rajoute pas beaucoup de pages, mais c'est pour le sport !

Mais le plus compliqué de cet objet, est qu'il ne s'agit pas de n'importe quel quadruplet. Il s'agit exactement d'un quadruplet qui vérifie 21 axiomes. Et là, crois moi, tu en gagnes, des dizaines de pages de preuves, quand tu veux prouver que certains objets que tu définis explicitement respecte ces 21 axiomes !


J'ai une dernière recommandation: avoir des formules très longues. Évitez les formules avec indices/exposants sur les indices/exposants, c'est assez illisible. En plus, les indices/exposants ne prennent pas beaucoup de place. Quand prouver que deux termes sont égaux se fait par une dizaine d'étape, et que les formules font trois lignes de longs, tu arrives facilement à prendre une page par égalité.

Attention cependant, quand tu utilises des formules de trois lignes de long, il faut que TOUT dans les trois lignes sert. Peut-être pas à chaque étape, mais au moins une fois durant l'égalité, sinon tu vas vouloir simplifier le tout et retirer la partie de la formule qui ne change jamais.

Cette dernière astuce est assez dure à utiliser en pratique, il est très rare que tu tombes naturellement sur des formules de trois ligne de long que tu aies envie de démontrer. En général, tu veux prouver des égalités qui ont un sens précis, explicable en français/anglais. Et si c'est humainement explicable, la formule est en général plus long.

Une technique qui marche bien pour obtenir des longues formules: Avoir dans ses formules plusieurs sommes de séquences, parfois imbriqués. Quand les preuves sont par induction, comme il est désagréable de faire des inductions imbriqué, chaque imbrication de sommes pourra justifier un lemme à part. De même, deux sommes côte à côte pourront aussi justifier deux lemmes, un pour chaque somme, et un corollaire pour montrer comment mélanger les deux lemmes.

Souvent, le but est de montrer qu'une somme de termes x_n est égal à une somme de terme y_n. On peut donc dans l'induction faire une somme partielle sur les x_n et une somme partielle sur les y_n, ce qui prend plus de place. Et si en plus x_n s'exprime en fonction de y_n et de y_{n+1}, (et donc que y_n s'exprime en fonction de x_{n-1} et x_n), il vaut mieux passer par un troisième terme intermédiaire, avec un terme dépendant d'une part de x_n et de y_n, et une partie avec un terme dépendant de x_n et de y_{n+1}.


Au cas où ça ne soit pas clair, tout ce qui précède consiste bien sûr en une liste de chose que je déconseille. Je n'encourage personne à écrire un papier de plus de 50 pages. Théoriquement, une seule faute fait tout s'effondrer, c'est mentalement un exercice périlleux. Même si, comme je l'ai déjà expliqué, je ne pense pas que ça puisse arriver, car quand on en arrive à faire tant de page, on a nécessairement une idée très clair de ce qui se passe, de comment tout s'agence, et dans ce cas, une petite faute fera juste prendre une déviation, mais ne bloquera pas tout accès au but final.

Et surtout, je suis bien conscient que la lecture d'un tel papier demande plus d'un mois de boulot, et que presque personne ne va le faire à moins que le résultat soit vraiment fondamental. Mais si vous avez démontré que P est (égal/différent) de NP, je ne pense pas que tu aies besoin de mes conseils (en fait, je ne pense pas que tu aies besoin de mes conseils).

Le seul vrai truc que je peux donner, et qui est déjà bien connu, c'est de faire des fichiers séparés. Mon article fait 20471 lignes de LaTeX (avec un fill-column à 70), et avant que je découpe en plusieurs morceau, ça finissait à prendre plus d'une seconde à Emacs de faire une sauvegarde (ce qui est ennuyeux car je fais le raccourci clavier pour sauvegarder à peu près à chaque fois que mes doigts arrêtent de taper.) De même, quand on édite une partie, compiler juste la partie qu'on édite, en commentant l'input des autres parties, peut faire gagner du temps (mais ça signifie que toutes les \newcommand doivent être fait dans le préambule). D'ailleurs, faites PLEIN de \newcommand (ici, j'en compte 391), après tout, le but c'était de faire un pdf long, pas un fichier latex long. Et factoriser ce qui revient souvent en commande, c'est bien !

Note

[1] je ne connaissais pas la traduction française de Upper-set avant aujourd'hui

Commentaires

1. Le jeudi 7 avril 2016, 09:08 par Athreeren

Je me demande combien de citations cet article va réunir. Et parmi elles, combien de personnes auront vraiment lu l'article... Quel journal accepte de publier des articles aussi longs ?

Si tu ne connaissais pas la traduction de Upper-set, j'imagine que tu n'as pas encore commencé la version française. Encore un perroquet de Gordon Brown ça, qui écrit sa brouette d'article* avec une plume qui sort d'où on sait.

* Oui, au singulier

2. Le jeudi 7 avril 2016, 16:50 par Arthur Milchior

L'idée c'est d'extraire 10 à 15 pages pour une conférence. Peut-être justifier un découpage ensuite pour publier en plusieurs fois, et sinon arxiv pour la totalité

Ajouter un commentaire

Le code HTML est affiché comme du texte et les adresses web sont automatiquement transformées.

Fil des commentaires de ce billet