Sujet

Voici la liste des 503 sujets de sketch que j'ai pu trouver sur le forum de la bande à Ruquier.

Je crois que je suis geek. Pour avoir cette liste voici ce que j'ai écris... ça va chercher sur les 10 premières pages de chaque thread forum les phrases qui contiennent le mot "SUJET" qui en général contient effectivement un sujet de sketch, et les met dans un fichier.

Ca fait 5 lignes... j'y ai passé plusieurs heures.. c'est désespérant.

rm url
for i in {0,25,50}; do wget -q -O - http://www.labandearuquier.com/forum/viewforum.php?f=21\&start=$i | grep "Aucun message" |sed 's~.*\(viewtopic.php?.*\)" class.*~http://www.labandearuquier.com/forum/\1\\\&start=azerty~' | sed 's/&/\\\&/g' >> url; done
rm sujet
for i in $(seq 0 20 200); do cat url | while read line; do w3m -dump $(echo $line|sed s/azerty/$i/) | grep "SUJET\|Sujet : " >>sujet; done ; done
sort sujet|uniq  > sujet_sort

Commentaires

1. Le mardi 16 août 2011, 22:02 par LCF, sous-cultivé.

C'est quoi, comme langage? Du PHP? Autre chose?

2. Le mercredi 17 août 2011, 17:52 par Arthur Rainbow

Bash

Tu ouvres une console sous linux, tu tapes ça, et tu obtiens le résultat dans le fichier "sujet_sort"
ça aura détruit les fichier "sujet" et "url" s'ils existaient... mais c'était pas le cas dans mon dossier, sauf comme résultat d'expérience raté pour récupérer les sujets de sketch.

3. Le vendredi 19 août 2011, 00:53 par LCF, instruit

Ok, merci!

Ajouter un commentaire

Le code HTML est affiché comme du texte et les adresses web sont automatiquement transformées.

La discussion continue ailleurs

URL de rétrolien : http://www.milchior.fr/blog/index.php?trackback/413

Fil des commentaires de ce billet