Automatisiertes Speichern von Website-Texten/Tabellen

  • Hallo,

    ich verarbeite Sportergebnisse in Tabellenkalkulationen bzw. Datenbanken. Die Ergebnisse finde ich in Tabellen von div. Webseiten. Mit copy&paste bringe ich die Web-Tabellen dann in die Tabellenkalkulation. Per Makro wird der Tabelleninhalt noch etwas "geglättet". Das funktioniert ganz gut.

    Nun möchte ich den Vorgang so weit wie möglich automatisieren. Daraus ergeben sich folgende einzelne Aufgaben, die darauf hinauslaufen, Firefox über Makro oder Batchprogramm zu steuern - geht das überhaupt ?

    1. Nacheinander Aufrufen verschiedener Webseiten, ev. Abspeichern für nachfolgende Offlinebearbeitung.

    2. Selektieren bestimmter Bereiche innerhalb einer Webseite und nachfolgendes Speichern der selektierten Teile in Tabellenkalkulation, ersatzweise auch in einfache Textdatei.

    Bevor ich eigene Experimente anstelle möchte ich fragen ob jemand hierfür schon Lösungen oder Lösungsansätze hat.

    Punkt (1) ist wohl einfach zu lösen durch Offline-Reader.

    Punkt (2) dürfte am schwierigsten sein. Ich weiß nicht wie bestimmte Positionen auf einer Webseite anzusteuern sind. "Ghostmouse" könnte eine Lösung sein, dann muß die Webseite aber immer präzise an derselben Stelle stehen.

    Für Anregungen bin ich im Voraus dankbar.

    Gruß
    g.eisleben

  • Zitat von eisleben

    1. Nacheinander Aufrufen verschiedener Webseiten, ev. Abspeichern für nachfolgende Offlinebearbeitung.


    a) Gib mal in die Forensuche ein:
    mehrere Startseiten

    b) Offline speichern: besuche diesen Link: hp kopieren & als dokument ausgeben

    Zitat von eisleben

    2. Selektieren bestimmter Bereiche innerhalb einer Webseite und nachfolgendes Speichern der selektierten Teile in Tabellenkalkulation, ersatzweise auch in einfache Textdatei.


    Table2Clipboard 0.0.2
    Ermöglicht das Kopieren ausgewählter Zeilen/Spalten einer HTML-Tabelle in die Zwischenablage und das Einfügen in Textdateien und Excel- oder Calc-Dokumente unter Beibehaltung der Zelleneinteilung.

    Auch die Kombination von Platypus mit Greasemonkey könnte weiterhelfen: mit Platypus lassen sich Webseiten ratz fatz von überflüssigem Krempel beseitigen, so daß im Idealfall nur die gewünschten Tabellen übrigbleiben. Das Ergebnis der Prozedur wird von Platypus als Greasemonkeyskript gespeichert.
    Künftig kann die Seite dann immer mit diesem selbst definierten Skript durch Greasemonkey geladen werden.

    Nur wie dann Makros funktionieren sollen, so daß die Inhalte vollautomatisch in eine andere Anwendung kopiert werden, dafür ist mir leider keine Lösung bekannt.
    ;)
    [Blockierte Grafik: http://img215.imageshack.us/img215/3636/firefoxbutton8us.png]
    ________________________________
    Gruß, gammaburst

  • @ gammaburst,

    besten Dank für die Informationen. Das geht genau in die Richtung, die ich suche.

    Speziell Platypus und Greasemonkey werde ich mir jetzt genauer vorknöpfen. Von der JavaScript-Einbindung verspreche ich mir einiges.

    Gruß
    g.eisleben