Beiträge von gammaburst

gammaburst

Internet Archive Wayback Machine - Read more about robots.txt

Zitat von web.archive.org

12. Robots.txt -- If our robot crawler is forbidden from visiting a site, we can't archive it.
...
13. Some sites are not available because of Robots.txt or other exclusions.
What does that mean?
The Standard for Robot Exclusion (SRE) is a means by which web site owners can instruct automated systems not to crawl their sites. Web site owners can specify files or directories that are allowed or disallowed from a crawl, and they can even create specific rules for different automated crawlers. All of this information is contained in a file called robots.txt. While robots.txt has been adopted as the universal standard for robot exclusion, compliance with robots.txt is strictly voluntary. In fact most web sites do not have a robots.txt file, and many web crawlers are not programmed to obey the instructions anyway. However, Alexa, the company that crawls the web for the Internet Archive, does respect robots.txt instructions, and even does so retroactively. If a web site owner ever decides he / she prefers not to have a web crawler visiting his / her files and sets up robots.txt on the site, the Alexa crawlers will stop visiting those files and mark all files previously gathered as unavailable. This means that sometimes, while using the Internet Archive Wayback Machine, you may find a site that is unavailable due to robots.txt or other exclusions. Other exclusions? Yes, sometimes a web site owner will contact us directly and ask us to stop crawling or archiving a site. We comply with these requests.

Zwar stoppt die Internet Archive Wayback Machine eine Archivierung, wenn sie auf entsprechende Einträge in der robots.txt trifft,

Beispiel von oben:
http://web.archive.org/web/20041020235857/www.quadrone.org/
Die robots.txt dieser Seite enthält folgende Einträge:
http://web.archive.org/web/2005031609….org/robots.txt
User-agent: *
Disallow: /error/
Disallow: /temp/
Disallow: /projects/qmax/
Disallow: /projects/mozilla/browser/

und bei der Internet Archive Wayback Machine kann man auch Einträge nachträglich aus deren Archiv entfernen lassen,
aber:
Es richten sich also nicht alle Crawler (Robots) von Suchmaschinen/Webverzeichnissen/Archiven nach den Vorgaben in der Datei robots.txt sondern handeln durch die Archivierung trotz entsprechender Einträge in die Datei robots.txt mE. gegen den erklärten Willen von Seitenbetreibern.

Dies sollte, falls es keine einheitliche internationale Richtlinie gibt, schleunigst geändert werden.
Nicht jeder hat Zeit, Geld und Lust, Inhalte von Internetseiten, die er nicht in Archiven aufgenommen haben will, aufwändig zu verschlüsseln und/oder mit Passwort zu versehen, zumal dann diese auch nicht mehr frei zugänglich wären.

Auf Heise (oder irgend wo anders im Internet, hab' ich leider nicht gebookmarked) wurde auch schon einmal angesprochen, daß durchaus nicht alle Usenet-Nutzer mit der Archivierung ihrer Beiträge bei Google einverstanden waren.
________________________________
[Blockierte Grafik: http://img215.imageshack.us/img215/3636/firefoxbutton8us.png]
Gruß, gammaburst

gammaburst

http://www.firefox-browser.de/forum/viewtopi…p=246533#246533

Zitat von liracon

zuerst solltest Du mal prüfen, was bei Deinen Downloadeinstellungen vermerkt ist.
Extras->Einstellungen->Downloads->Aktionen anzeigen&Bearbeiten.

http://www.firefox-browser.de/forum/viewtopi…p=208407#208407

Zitat von Alexxander

über Extras / Einstellungen / Downloads / Aktionen anzeigen & bearbeiten / Aktion ändern die gewünschten Programme einstellen?

________________________________
[Blockierte Grafik: http://img215.imageshack.us/img215/3636/firefoxbutton8us.png]
Gruß, gammaburst

gammaburst

Ein Artikel zu Internetarchiven, der neben der Archivierung des Usenet durch Google auch die "Internet Archive Wayback Machine" behandelt, befindet sich hier:
Das Gedächtnis des Internets (Link)
________________________________
[Blockierte Grafik: http://img215.imageshack.us/img215/3636/firefoxbutton8us.png]
Gruß, gammaburst

gammaburst

Zitat von tszr

kommt noch ein 2. lehres fenster vom firefox, das ist echt mühsam, es gibt ein tool bis zum firefox 1.0 auf http://www.erweiterungen.de leider lässt es sich nicht am 1.5.01 installieren
und ich finde nirgerns wo ich diese funktion um sie zu deaktivieren.

Die Erweiterung Disable Targets For Downloads kannst Du hier herunterladen:
https://addons.mozilla.org/addon.php?id=241

Zitat

Disable Targets For Downloads 1.0.1, by Ben Basson, released on Jan 5, 2006
Prevents sites spawning blank windows when clicking binary downloads.
Works with:
Firefox Firefox 0.8 - 1.5.0.* ALL

________________________________
[Blockierte Grafik: http://img215.imageshack.us/img215/3636/firefoxbutton8us.png]
Gruß, gammaburst

gammaburst

Webseitenbetreiber können verhindern, daß Daten durch den Robot der Wayback Machine aufgenommen werden,

z.B. auf der Seite die der Suchmaschine übergeben wurde mit dem Seitentitel Quadrone's Cache:
http://web.archive.org/web/20041020235857/www.quadrone.org/

wird durch Einträge in die Datei robots.txt eine Archivierung bestimmter Verzeichnisse ausgeschlossen:
http://web.archive.org/web/2004102023…ozilla/browser/

Zitat von WaybackMachine

Robots.txt Retrieval Exclusion.
We're sorry, access to http://www.quadrone.org/projects/mozilla/browser/ has been blocked by the site owner via robots.txt.
Read more about robots.txt
See the site's robots.txt file.
Try another request or click here to search for all pages on http://quadrone.org/projects/mozilla/browser/
See the FAQs for more info and help, or contact us.

Ein interessantes Feature der Wayback Machine ist sicher daß ganz normal über die Links in den Archiven gesurft werden kann, besonders bei Seiten, die große Archive ergeben wie Mozilla Update.
Schon gut, daß Anwender Inhalte für Suchmaschinen ausschließen können, dies ist ein imho wichtiger Punkt.
________________________________
[Blockierte Grafik: http://img215.imageshack.us/img215/3636/firefoxbutton8us.png]
Gruß, gammaburst

gammaburst

Für das Portal gibts auch Searchplugins:
http://mycroft.mozdev.org/download.html?…bmitform=Search
________________________________
[Blockierte Grafik: http://img215.imageshack.us/img215/3636/firefoxbutton8us.png]
Gruß, gammaburst

gammaburst

Zitat

Wer googled, der findet??
Habe gerade nach "perl list objects" gegoogled. Und das erste Suchergebnis ist: Die Bahn, mit einer Reise von Perl nach List (Sylt).
Google-Suche: perl list objects
posted by Stephan @ 15:48

http://tacuissem.blogspot.com/2005_03_01_tac…210412143668513

________________________________
[Blockierte Grafik: http://img215.imageshack.us/img215/3636/firefoxbutton8us.png]
Gruß, gammaburst

gammaburst

Zitat

Neue Sportart entdeckt...
Wie Basketball - nur irgendwie ohne Ball

via http://tacuissem.blogspot.com/2005_01_01_tacuissem_archive.html

________________________________
[Blockierte Grafik: http://img215.imageshack.us/img215/3636/firefoxbutton8us.png]
Gruß, gammaburst

gammaburst

Wem's zu sehr eiert, kann sich ja mal zum Ausgleich die Kreiszahl Pi anhören: Begin Pi

Auf der Seite befinden sich noch weitere (imho) interessante Experimente.
________________________________
[Blockierte Grafik: http://img215.imageshack.us/img215/3636/firefoxbutton8us.png]
Gruß, gammaburst

gammaburst

Zitat von Dr. Ä

Sich ein hartes Ei kochen geht
Dok.

Zitat von <woltlab-metacode-marker data-name=

Stephan" data-link="">

Assoziationen...

Links sind ja so wie Assoziationen, nur halt in elektronischer Form. Ähnlich wie bei Gesprächen findet man sich im Internet oft auf irgendeiner Seite wieder, um irgendeine Erkenntnis, auf die man natürlich immer schon gewartet hat, reicher und weiss nicht so recht, wie man dorthin gelangt ist:
So auch bei mir. Ich habe in Firefox eine Extension installiert, mit der man seine Frühstückseier timen kann (EggOn). Leider werden meine Eier immer nicht so, wie ich sie will und wie sie mir von dem Programm versprochen werden. Daher wollte ich wissen, was für Zeiten im Programm gesetzt wurden und auf der Suche bin ich auf die Release-Party von EggOn gestossen. Und auf dem dritten Bild von oben (ich schau mir halt gerne die Bilder an) sieht man ASCII-pr0n.
ASCII-pr0n, was ist denn das?? Nun, das sind mehr oder minder bekleidete Frauen (und Männer), gezeichnet mit ASCII-Zeichen. Zum Beispiel auf http://www.asciipr0n.com sind einige schöne Exemplare zu sehen:

posted by Stephan @ 21:01 0 comments

________________________________
[Blockierte Grafik: http://img215.imageshack.us/img215/3636/firefoxbutton8us.png]
Gruß, gammaburst

gammaburst

Die Extension besteht aus einem Egg-Timer mit drei Einstellungen, um das perfekte Ei nach Ihrem Geschmack zu kochen. Passend zur Osterzeit.

[Blockierte Grafik: http://rely.ca/eggon/images/eggon100.png]

Zitat von <woltlab-metacode-marker data-name=

EggOn!" data-link="">

EggOn! is a Firefox extension for cooking the perfect egg. EggOn has three settings, so you can cook perfect eggs according to your tastes. Yes, EggOn! is essentially an egg timer for your web browser.

EggOn 0.1.1 has been released, it is now compatible with Firefox 1.5!!!
Big ups to team member Jordie for dragging us back to the future.

http://www.fcdnet.org/japerry/2004/1…arty-eggon.html
https://addons.mozilla.org/extensions/mor…id=392&vid=1282

________________________________
[Blockierte Grafik: http://img215.imageshack.us/img215/3636/firefoxbutton8us.png]
Gruß, gammaburst

gammaburst

Die Fraunfofer-Gesellschaft stellt im Rahmen ihrer Neuentwicklung Semantisches Netz/Topic maps (verstärkt für Intranet-Anwendungen gedacht) testweise einen sog. Music Recommender (Link) zur Internetsuche vor.

Der Music Recommender ist imho wertvoll, wenn Gruppen oder Interpreten gesucht werden, die ähnliche Musikstile haben, wie die Musikgruppe, die als Suchbegriff eingegeben wurde.

http://www.ipsi.fraunhofer.de/ipsi/press/pre…_conweaver.html
http://www.ipsi.fraunhofer.de/contec/deutsch…products_d.html
http://www.conweaver.de/

________________________________
[Blockierte Grafik: http://img215.imageshack.us/img215/3636/firefoxbutton8us.png]
Gruß, gammaburst

gammaburst

Hier ist ein Script für Greasemonkey, das allerdings auf einen etwas anderen Zweck zugeschnitten ist:
http://forums.mozillazine.org/viewtopic.php?…tomatic#1301704

Es lädt nach einer eingestellten Zeit (hier 30 Sekunden) eine Seite neu, die sich normalerweise selbst neu laden sollte. Tut sie das aus unerfindlichen Gründen nicht, greift das Greasemonkeyscript und lädt sie dennoch.

Das Script müßte sich (vllt.) relativ leicht anpassen lassen, so daß die gewünschte Startseite geladen wird.
________________________________
[Blockierte Grafik: http://img215.imageshack.us/img215/3636/firefoxbutton8us.png]
Gruß, gammaburst

gammaburst

In diesen Threads befinden sich Links zu Downloadquellen von Open- und ClosedSource-Software, die PDF erstellen kann:
http://www.firefox-browser.de/forum/viewtopi…1&highlight=pdf
http://www.firefox-browser.de/forum/viewtopi…5&highlight=pdf
http://www.firefox-browser.de/forum/viewtopi…2&highlight=pdf
http://www.firefox-browser.de/forum/viewtopi…1&highlight=pdf
http://www.firefox-browser.de/forum/viewtopi…3&highlight=pdf

Die Forumsuche funzt.;)
________________________________
[Blockierte Grafik: http://img215.imageshack.us/img215/3636/firefoxbutton8us.png]
Gruß, gammaburst

gammaburst

In den MozillaZine Forums befindet sich dieser Thread:
Proxy only certain URLs (Link).
Es soll eine PAC-Datei mit den gewünschten Proxy-URL's angelegt werden, der Pfad der Datei wird gespeichert unter
Extras > Einstellungen > Allgemein > Verbindungs-Einstellungen > Automatische Proxy-Konfigurations-URL

Zitat von <woltlab-metacode-marker data-name=

Unarmed" data-link="">

PostPosted: Jan Thu 19th 2006 7:44pm
You can do this with a PAC file. This is a text file containing JavaScript to decide whether or not to use a proxy, given a destination. You’d enter the path to this file under Tools → Options → General → Connection Settings... → Automatic proxy configuration URL.

http://wp.netscape.com/eng/mozilla/2.…proxy-live.html

________________________________
[Blockierte Grafik: http://img215.imageshack.us/img215/3636/firefoxbutton8us.png]
Gruß, gammaburst

gammaburst

Auf der Seite http://dunck.us/collab/GreaseMonkeyUserScripts
befindet sich ein Greasemonkeyscript namens Zoom Textarea (Link).

Darin diese Variablen und (unter Anderem) die Textzoomfunktion:

Zitat

var textareas, textarea;
textareas = document.getElementsByTagName('textarea');
if (!textareas.length) { return; }
function textarea_zoom_in(event) {
var link, textarea, s;
link = event.currentTarget;
textarea = link._target;
s = getComputedStyle(textarea, "");
textarea.style.width = (parseFloat(s.width) * 1.5) + "px";
textarea.style.height = (parseFloat(s.height) * 1.5) + "px";
textarea.style.fontSize = (parseFloat(s.fontSize) + 7.0) + 'px';
event.preventDefault();
}

Alles anzeigen

Vielleicht kann man ja relativ leicht seitenspezifische Tags hinzufügen und mittels derer den Zoomfaktor (Fontgröße) von der jeweils aufgerufenen Seite abhängig machen?
________________________________
[Blockierte Grafik: http://img215.imageshack.us/img215/3636/firefoxbutton8us.png]
Gruß, gammaburst

gammaburst

Zitat von captain chaos

Es ist jetzt möglich, Greasemonkey-Scripts in Extensions zu verwandeln:
Greasemonkey Script Compiler
(via)

auch dort:
http://www.letitblog.com/greasemonkey-compiler/
________________________________
[Blockierte Grafik: http://img215.imageshack.us/img215/3636/firefoxbutton8us.png]
Gruß, gammaburst

gammaburst

Zitat von coce

Es gibt jetzt offenbar eine Erweiterung, die Tooltips für die Lesezeichen-Symbolleiste anzeigt: boox (Link); die Erweiterung kann allerdings noch einiges mehr.

http://www.firefox-browser.de/forum/viewtopi…p=249546#249546

________________________________
[Blockierte Grafik: http://img215.imageshack.us/img215/3636/firefoxbutton8us.png]
Gruß, gammaburst

gammaburst

Zitat von bugcatcher

es ist nicht mehr die strategie von MS den IE als Browser durchzusetzen. Die verlagern sich immer mehr auf andere Bereiche

Der Weltmarktführer will ein neues Format als odf-Konkurrenz entwickeln:
http://www.heise.de/newsticker/meldung/71253
http://www.heise.de/newsticker/meldung/64262
________________________________
[Blockierte Grafik: http://img215.imageshack.us/img215/3636/firefoxbutton8us.png]
Gruß, gammaburst

gammaburst

Zur Farbbestimmung von Webseiten ist auch der Color Contrast Analyzer (Link) geeignet.
________________________________
[Blockierte Grafik: http://img215.imageshack.us/img215/3636/firefoxbutton8us.png]
Gruß, gammaburst

Beiträge von gammaburst

www.archive.org !!! Chronologische Webseiten-Speicherung !!!

schnelles öffen von pdf,word,excel, csv dateien usw.. ?

www.archive.org !!! Chronologische Webseiten-Speicherung !!!

schnelles öffen von pdf,word,excel, csv dateien usw.. ?

www.archive.org !!! Chronologische Webseiten-Speicherung !!!

www.archive.org !!! Chronologische Webseiten-Speicherung !!!

Neue Suchmaschinen

Der ultimative "lustige Sachen Thread"

EggOn! Firefox-Erweiterung zum Kochen des perfekten Ei's

EggOn! Firefox-Erweiterung zum Kochen des perfekten Ei's

EggOn! Firefox-Erweiterung zum Kochen des perfekten Ei's

Neue Suchmaschinen

Greasemonkey - Script zum automatischen Laden der Startseite

pdf-Konverter

Automatische Proxy(de)aktivierung auf definierten Seiten

Zoom automatisieren ... oder so ?

Eure Lieblings-Greasemonkey Skripte

Tooltip Lesenzeichen Sidebar (erl.)

IE + :hover?

Bild-Abmessungen bei Mouseover anzeigen?