Général ou Particuliers

Pour une raison que j'ignore, j'ai un problème qui se pose dans la moitié de mes résultats de recherche. J'ai des résultats très généraux. Voir trop.

Quand je fais des maths, y a deux trucs dont j'ai envie: des preuves compréhensible, et des théorèmes aussi général que possible. Le premier point et le deuxième s'opposent souvent. Par exemple, en analyse, beaucoup de théorème sont enseigné sur les nombres réels, et les complexes, mais sont vrai en fait sur n'importe quel espace métrique, voir n'importe quel espace topologique. Sauf que c'est beaucoup plus simple de dire qu'on a une fonction continue de R dans R que de dire qu'on a une fonction continue, puisque ça nécessite de définir ce qu’est une mesure, un ensemble mesurable et une fonction mesurable. Et qu'en pratique, si tu dis «R», ça a toute les bonnes propriété, et qu'on a plus d'intuition si on dit que «|x-y|<e» plutôt que si on reformule en terme de suite d'ensemble ouvert.

Bien sûr, la notion topologique est extrêmement intéressante, elle permet d'aller loin, de traiter des cas différents. Mais elle est plus difficile à comprendre. Et souvent[1], tu peux faire la définition sur R puis dire que modulo le changement de formalisme, la même définition marche pour toute topologie.

Note

[1] dans les exercice des premières année d'université

Il est hors de question de jeter la topologie, ça concerne bien trop de notion. Mais quand tu vas dans des domaines moins joli, tu peux aussi te retrouver avec deux objets très semblable, deux preuves très semblables. Et là, ça devient problématique, est-ce que tu fais deux papiers, ou est-ce que tu en fais qu'un ? Si tu en fais deux, ça double ton nombre de publication, ce qui est bien pour ta carrière. Et puis ça peut être dans deux journaux différents, s'adressant à deux types de personnes différentes, si t'as un peu de chance. Le souci, c'est que c'est un peu «triché», ça augmente inutilement le nombre de papier, si quelqu'un s'intéresse aux deux résultats, tu lui fait prendre plus de temps à te lire deux fois. Et surtout, tu ne mets pas en avant la proximité de ces deux résultats, et souvent, voir que deux choses sont proches peut être scientifiquement très intéressant, car donner des idées pour utiliser un résultat d'un domaine dans l'autre domaine.

Le souci, si tu fais un seul papier, c'est que tu dois expliciter ce qui rapproche les notions, parfois créer ta notation, et donc tes lecteurs ne pourront pas se reposer sur l'intuition qu'ils se sont formés, et auront plus de mal à lire. Surtout si un morceau de preuve est distinct, il faudra retrouver à quoi s'applique un morceau, si on s'intéresse a un des deux cas et qu'on lit le bout de preuve fonctionnant sur l'autre, on peut être perdu. Et en faisant deux papiers, tu évites ça.


Ce problème je l'ai sans arrêt depuis le Master 1. Sauf que c'est jamais que deux cas. Ça serait trop simple.

Mon premier résultat, je cite des gens, ils ont fait trois papiers. Ces trois papiers ont chacun un résultat, et chacun de ses trois résultats utilise la même idée globale. Mon résultat traite en pratique huit cas différents, en généralisant entre autre leur idée. Chacun de ces huit cas demande juste des variations sur des détails de la preuve, mais l'idée globale est la même.

Je dis entre autre, parce que c'est de la logique d'ordre supérieure. Si vous savez pas ce que c'est, c'est pas bien grave. Disons qu'une logique à un ordre. Traditionnellement, on étudie la logique d'ordre 1, parfois celle d'ordre 2, rarement plus. Au delà, on parle de logique d'ordre supérieure. Et bien, il se trouve que des tas de résultat de complexité descriptive on été prouvé pour la logique d'ordre 1, ça a donné lieu a des dizaines de papiers. Puis des gens on montré qu'il y avait des résultats similaires pour la logique d'ordre 2, ce qui a donné lieu à quelques autres papiers. Et devinez quoi: les mêmes résultats sont vrai en logique de n'importe quel ordre. Pourquoi ça n'a pas été montré en même temps, je ne sais pas, peut-être comme je disais, car c'est plus simple en étant moins général. Et puis la logique d'ordre 3 n'intéresse pour ainsi dire personne, par rapport à celle d'ordre un et deux. Encore une fois, le même souci se pose.

Il y a en gros 9 résultats de base dans ce domaine, 3 ont été montré pour l'ordre supérieur, j'ai prouvé que les 9 sont vrais, dont en particulier les trois déjà prouvé. Alors, est-ce que je tente de faire 6 papiers ? Ou un seul ? J'ai tenté un seul. Après, comme j'ai soumis trois fois et est été refusé trois fois [1], la question est purement théorique.


Mais ce n'est pas fini. Depuis 2013, je travaille sur un résultat reliant logique et automate. Et ce résultat vaut pour 16 formalisme logiques différents. 16 n'est pas un nombre magique, ou quoi que ce soit, il a pas de propriété mathématiques spécifique dans ce cas là. J'ai juste compté tout ce que j'ai réussi à faire rentrer dans mes critères, et je suis tombé sur 16. Qui sont tous assez proche les uns des autres.

Ainsi, je travaille sur des formules logiques considérant les ensembles d'entiers, parfois positifs parfois aussi négatifs. En fait, pour traiter le cas général, je dois d'abord le cas des ensembles de nombres positifs, passer d'un cas à l’autre est presque simple[2], donc on pourrait se dire que pour simplifier le papier, qui fait tout de même 63 pages, je pourrais me restreindre au positif, et gagner une dizaine de page. D'un autre côté, il sera impossible de publier le cas avec les nombres négatifs tout seul, il n'est pas assez intéressant pour valoir une publication à lui tout seul.

Alors, dit comme ça, ça a l'air de rien, si vraiment je réduit Z à N[3], alors on peut lire que la partie sur N si ça nous intéresse. Et ça ira. Ça serait beau si c'était le cas. Sauf qu'en fait, quand on considère les sous ensemble de Z, on doit tenir compte de quelques petits détails supplémentaire. Qui ne changent pas fondamentalement la preuve, à part sur un point ou deux. Mais qu'on doit quand même se trimballer dans les notations dans la cinquantaine d'autres pages !

Bon, c'est une petite notation, un indice, c'est pas bien grave.

Mais j'étudie 9 logiques différentes sur N. Plus précisément, c'est toujours de la logique du premier ordre, ce qui change, c'est le vocabulaire, l'ensemble des fonctions et prédicats que je m'autorise. Et aussi l'ensemble des quantificateurs. Ma première étape est de toute façon d'éliminer les quantificateurs, donc je peux me restreindre à voir des logiques sans quantificateurs. Sauf que FO(<,mod), c'est quand même plus joli que \Sigma_0(\N,<,+\N,mod)[4]. C'est plus court, et puis on voit mieux ce que c'est à priori, c'est les formules avec la relation d'ordre et les relations modulaires. Le souci, c'est que j'ai aussi FO(+1,mod) et FO(=N)[5]. Et c'est tout ce que j'ai sans quantificateur. \Sigma_0(<,+N,mod) par exemple, une logique ou on a l'ajout de constante, l'ordre et les prédicats modulaires, mais pas de quantificateurs, n'a pas d'équivalent avec quantificateurs, puisque l'addition de constante permet toujours de définir les constantes quand il y a des quantificateurs, et qu'ici les constantes ne sont pas considérées.

Alors, la question se pose, est-ce que ça vaut le coup de considérer cette logique ? D'un côté elle est pas très intéressante, n'est jamais étudiée pour elle même, n'a pas de propriété aussi intéressante que FO(<,mod), la classe des ensemble régulier. D'un autre côté, le résultat fonctionne, avec (quasi)-exactement la même preuve, alors autant le mettre, si un jour quelqu'un en a besoin, ça sera là, il aura pas à chercher comment adapter mon théorème. Le diable est dans les détails, c'est «quasi», il y a un petit point qui se rajoute un peu partout, qui rajoute une ou deux ligne pour traiter ce cas dans une dizaine de lemme, c'est pas grand chose sur 63 pages, mais quand même...

Mais si je le prend pas, je garde quoi ? Après tout, traiter une seule logique serait bien plus simple, et le lecteur se souviendra plus facilement de ce que signifie FO(<,mod) que de ce que signifie FOV, où V est un vocabulaire qui peut prendre 16 valeurs.

Et si je les gardes tous, comment est-ce que je décris cet ensemble de 16 valeurs ? Je fais la liste exhaustive ? Alors on ne voit pas la logique derrière, et aucun lecteur, même moi, peut se souvenir de la liste par cœur en lisant les 63 pages. Mais si je donne les conditions qui caractérisent ces logiques, alors ça devient compliqué de voir quel est l'ensemble des logiques qui respectent cette caractérisation. Mais ce n'est pas comme si je devais faire le choix une seule fois, sinon, ça serait pas bien grave, je pourrai juste donner la liste une fois, avec sa caractérisation. Mais régulièrement, je dois dire que tel lemme est vrai, car si on suppose que ceci est dans V, alors on sait que cela est dans V, ou alors dire que dans ce cas précis, le lemme se fait comme ceci, sinon comme cela.


Comme conclusion, je dirai juste que j'aimerai bien que c'est vraiment pas un des problèmes les plus compliqués dans la recherche. Mais quand même, ça obsède.

Notes

[1] Pas assez clair, pas assez intéressant pour la prestigieuse conférence où c'est soumis

[2] relativement au reste du papier

[3] oui, j'en ai assez, j'utilise les notations mathématique, mais bon, c'était niveau lycée

[4] Désolé, j'ai la flemme de chercher un mod pour les maths

[5] Ici =N correspond à l'ensemble des constantes

Commentaires

1. Le dimanche 5 avril 2015, 08:45 par Athreeren

Écrire ce genre d'article doit en effet être compliqué. Mais la question que je me pose, c'est qu'est-ce que tu dis dans le résumé ? Si tu ne donnes pas tous les cas, tu obliges le lecteur à lire l'article, mais si tu donnes tous les résultats, ça rend le résumé incompréhensible. D'un autre côté, c'est la même chose en science : tes données peuvent parfois être utilisées pour prouver autre chose que l'hypothèse initiale, et si le résultat ne mérite pas un article, tu ne peux pas réécrire un autre article qui va décrire la même expérience, juste pour montrer un résultat mineur.

Aussi, en mathématiques, tu ne peux pas te permettre des imprécisions de notations, et il est donc nécessaire de dire clairement ce que tu as prouvé et les limites de ta preuve. En sciences, un résultat qui n'est pas correctment prouvé pourrra être cité dans plusieurs articles avant d'être mis en doute, mais ça n'invalide pas nécessairement ces articles ; en mathématiques, on peut prouver n'importe quoi en s'appuyant sur des hypothèses fausses, et il serait donc irresponsable de laisser des imprécisions dans l'article.

Enfin, la solution est heureusement évidente : tu écris ton papier pour le cas le plus intéressant, et tu publies le reste (les résultats qui ne rentrent pas dans l'article mais ne méritent pas un article eux-même) sur une archives ouvertes (solution intermédiaire : en annexe de l'article)

À quoi ça ressemble, une conférence de maths ? Tu ne peux pas expliquer ta preuve correctement à l'oral. C'est comme une présentation dans une conférence d'informatique, où tu expliques l'idée de l'algorithme sans aller dans les détails du code ? Mais dans celles-ci, le plan est généralement : problème à résoudre, idée générale du code, résultats obtenus par le programme vis-à-vis du problème considéré, recherche ultérieure ; je ne suis pas sûr que ce plan s'applique pour des maths aussi abstraites.

2. Le mercredi 15 avril 2015, 00:50 par Arthur Milchior

Dans l'abstract je donne le cas principal, celui qui justifie la recherche initiale, et dit que d'autres existeront. 

L'annexe serait pas publié en conf. Mais oui, y a des chances que je fasses ce que tu dises, une fois le résultat principal officiellement publié (ce qui simplifie les notations et les preuves), la version complètes finisses sur Arxiv comme un article à part. Et de toute façon finisse aussi dans ma thèse.

Je suis informaticien, je ne fais pas de conf' de math. Je ne connais pas de conf ou tu fasses la preuve complète, à la limite, tu présente la grande idée générale, qui est l'outil intéressant que tu as employé, pour le faire connaitre et peut-être que d'autres puissent réutiliser cet outil théorique sur leur problème. Mais surtout, tu passes beaucoup de temps à expliquer quel est le problème que tu as résolus et pourquoi tu l'as résolu.

Ajouter un commentaire

Le code HTML est affiché comme du texte et les adresses web sont automatiquement transformées.

Fil des commentaires de ce billet