Est-il possible d'obtenir le code source html d'une page Web avec curl et d'exécuter un interpréteur javascript, puis-je obtenir le contenu généré?
La page, j'ai besoin d'utiliser un contenu codé et modifié pour que je voulais d'abord exécuter le javascript pour obtenir le contenu échappé et généré … ou dois-je regex le javascript et "compiler" le javascript par moi-même? Comme
curl <myurl> | perl -ne 'm/unescape\((.*)\)/; print "$1"' | <now to something with that>
Je savais qu'il n'y a pas de moteur javascript dans curl, mais puis-je simplement appeler un autre script / programme pour faire le travail?
Vous pouvez le faire, mais il est plus impliqué que je ne le pense. Ni curl
ni wget
ont des moteurs Javascript, donc vous aurez besoin de quelque chose qui en a un.
Je commencerais par regarder PhantomJS .