Download einer Webseite mit Firefox headless über die Kommandozeile

  • Firefox-Version
    83.0
    Betriebssystem
    Ubuntu 20.04

    Hi,

    mir ist schon recht häufig passiert, dass ich ein bestimmtes Suchergebnis in einem Forum gefunden habe, dessen Beitrag ich lesen konnte ohne angemeldet zu sein - die Seite konnte ich dann aber nicht herunter laden. Daran scheiterte sowohl wget als auch httrack. Mit Firefox (Dateien / Seite Speichern unter) ging das fast immer, nicht aber mit headless Firefox. Was ist da anders? Ich finde die headless Funktion schön im URLs zu sammeln und dann in einem Aufwasch laden zu können. Was ist da anders? Was muss ich machen, damit die gleichen Seiten auch automatisiert mit Firefox headless geladen werden können? Fehlen da die Cookies?

    Leider habe ich gerade kein konkretes Bsp. Hab es gerade mal mit camp-firefox.de versucht, da klappt der Download über die Kommandozeile.

    Richard

  • Da war ich schon.

    Es gibt keine "bestimmten Seiten", aber das hatte ich ja schon geschrieben

    Code
    Leider habe ich gerade kein konkretes Bsp.

    Das betrifft oft Foren in denen ich lesen kann ohne angemeldet zu sein.

    Diese werden im normalen Firefox korrekt angezeigt aber scheinbar im headless nicht. Das kann auch die von dir verlinkte Seite nicht aufklären.

  • Das betrifft oft Foren in denen ich lesen kann ohne angemeldet zu sein.

    Und du meinst, ich frage zum Scherz nach einer nachvollziehbaren Adresse? Dann kann das Problem ja nicht so gross sein, wenn du dazu keine Antwort geben magst.

    Wir sind keine Beschwerdestelle, hier gibt es nur Lösungen! Meine Glückszahl hier: 93.

    Einmal editiert, zuletzt von .DeJaVu (11. Dezember 2020 um 21:49)