AIR Html parser - Coding - Blog - seekwhencer - privates blog

AIR Html parser

AIR ist ja quasi die Geheimwaffe für automatisierte Klickerei auf Webseiten. Man kann sich einloggen und schön Requests abfeuern. Das funktioniert astrein, bisweilen erschreckend einfach.

Damit AIR sich eine Website holt, kann man folgendes machen:

var Load = {
    getUrl : function(query){
        var request     = new air.URLRequest(query);
        var loader       = new air.URLLoader();
            
        loader.addEventListener(air.IOErrorEvent.IO_ERROR, Load.errorIO);
        loader.addEventListener(air.Event.COMPLETE, Load.getComplete);
        loader.load(request);
    },

    errorIO : function(e){},
   
    getComplete : function(e){
        var result = e.target.data;
    }
}

Der HTML-Code stehen dann in der getComplete als e.target.data zur Verfügung. Wenn man jetzt das parsen möchte, kippt man das ganze einfach in den DOM und durchforstet das mittels Prototype. So ungefähr:

var data         = e.target.data;
var body        = data.split('<body');
       
var site         = document.createElement('html');
site.update('<body'+body[1]);

var items       = site.getElementsByTagName('a');