Suche

Dem hoergen - Blog

  • Startseite
  • hyperblog
  • hoergen
  • moosiqpipl
  • Tiefschneider
  • hyperwiki
  • Kontakt
  • Anmelden

Mit wget oder wget2 Sounds, Bilder usw von einer Webseite runterladen

von hoergen am Okt 4, 2019 in Chiphead, Programme, Linux

Um auf Firefox Addons zu verzichten, die man ja sowieso nur alle paar Jahre braucht, oft resourcenintensiv und ebenso oft recht langsam sind benutze ich lieber das Kommandozeilen Programm wget, oder wget2 um Dateien wie Sounds oder Bilder auf einer Seite in einem Rutsch runter zu laden. Wenn du Linux benutzt, dann ist wget oft schon vorinstalliert. wget2 muss meist extra installiert werden. Die anderen, die immer noch Windows oder Mac benutzen finden ohne große Probleme eine portierte Version für ihren Computer.

Um jetzt eine große Liste von Sounds (z.B AIF) von einer Webseite runter zu laden, die dort einzeln verlinkt sind gibt man z.B. Folgendes ein:

 

wget2 -P "/home/Benutzer/Download/"-nd -r -l 2 -H -A aif https://bsp.de/blah.html

 

Die Schalter bedeuteten

  • -P (path) gibt den Pfad zu deinem Zielverzeichnis an, in dem die Dateien auf deiner Festplatte gespeichert werden sollen.
  • -nd (no directories) erstelle keine Verzeichnisse/Unterverzeichnisse, sondern speichere alles in das aktuelle Verzeichnis
  • -r (recursive) sucht auch in Unterverzeichnissen nach den angegebenen Dateien
  • -l 2 (recursive level 2) zum “r” Schalter gibt man IMMER den “l” Schalter mit (in diesem Beispiel 2), da dieser definiert, wie tief wget in die Unterverzeichnisse hinabsteigen soll, um zu vermeiden, dass du dir aus Versehen das gesamte Internet auf die Festplatte lädst.
  • -A (accepted extensions), hinter diesem Schalter gibst du die Datei-Endungen wie AIF, WAV, JPG, PNG oder eben die Dateien, die du runterladen willst an.
  • -H (span hosts) Wenn sich die Dateien nicht auf dem selben Server befinden, musst du den Schalter “H” noch mit angeben, weil wget standardmäßig nur Dateien von dem Server runterlädt, wohin auch die angegebene Adresse zeigt. Gehe VORSICHTIG damit um!
  • Adresse ,ganz zum Schluss gibst du dann noch die Adresse ein, wo die Dateien verlinkt sind z.B. sowas  https://bsp.de/blah.html

Es gibt dann noch den Schalter -e robots=off der besagt, dass WGET sich nicht als “robot ” zu erkennen geben soll. Viele Webseiten nutzen die robot Datei, um Suchmaschinen oder anderen Webcrawlern zu sagen: Bleibt hier fern und verursacht keine unnötig hohe Bandbreitenauslastung, denn wir wollen nicht in eurer Suchmaschine auftauchen.

Bitte gehe respektvoll mit dem robots Schalter um und überlege dir vorher, ob du wirklich das gesamte Internet runerladen willst, oder ob du nicht wirklich nur einen Teil davon brauchst.

 

 

Ansichten: views
Tags: Tags: addonalternativefirefoxlinuxsoundwgetwget2
Dieser Eintrag wurde eingetragen von hoergen und ist abgelegt unter Chiphead, Programme, Linux. Tags: addon, alternative, firefox, linux, sound, wget, wget2
  • « Zentralisiert, Dezentralisiert und Verteilt - Was ist was?
  • Onlinesucht - Dopamin und Käsekuchen »

Noch kein Feedback


Formular wird geladen...

XML-Feeds

  • RSS 2.0: Einträge
  • Atom: Einträge
  • RDF: Einträge
  • RSS 0.92: Einträge
What is RSS?

Tag-Cloud

android basketball berlin datenschutz facebook friendica geschichten linux problem twitter

©2019 by Dem Sir hoergen • Kontakt • Hilfe • b2