Comment obtenir la source HTML d'un site Web avec PhantomJS

Voici un exemple de PhantomJS qui obtient un élément par ID DOM à partir d'une page Web externe:

var page = require('webpage').create(); console.log('The default user agent is ' + page.settings.userAgent); page.settings.userAgent = 'SpecialAgent'; page.open('http://www.httpuseragent.org', function(status) { if (status !== 'success') { console.log('Unable to access network'); } else { var ua = page.evaluate(function() { return document.getElementById('myagent').textContent; }); console.log(ua); } phantom.exit(); });

Je souhaite avoir l'intégralité de la source HTML d'une page Web … Comment puis-je faire cela?

Tout ce que vous avez à faire est d'utiliser le page.content

 var page = require('webpage').create(); page.onError = function(msg, trace) { //prevent js errors from showing in page.content return; }; page.open('http://www.httpuseragent.org', function () { console.log(page.content); //page source phantom.exit(); });