KONDZIO.INFO

Blog Konrada

HTTrack Website Copier - problem z pobieraniem strony

Ocena użytkowników: 0 / 5

Gwiazdka nieaktywnaGwiazdka nieaktywnaGwiazdka nieaktywnaGwiazdka nieaktywnaGwiazdka nieaktywna
 

Bardzo przydatny program do zapisywania całych stron www na dysk... np gdy strona jest niezwykle ciekawa a istnieje podejrzenie, że może ona zniknąć z sieci.... tak jak to było ze stroną jastrzab.lhs.pl - jak ona istniała nie miałem jeszcze nawyku zapisywania najciekawszych stron na dysk a teraz żałuję, że nie ma do niej dostępu.

 

Może się zdarzyć, że serwer zapobiega pobieraniu wszystkich plików i blokuje połączenie. Ale HTTrack ma możliwość podszywania się pod google boota a więc wtedy serwer nas nie zablokuje.

Po wybraniu nazwy projektu i miejsca do zapisu klikamy na "dalej"
W kolejnym oknie w działanie wybieramy "Pobierz stronę web" dla pobierania nowej strony albo "wznów tworzenie lustra" gdy chcemy zaktualizować istniejący zapis strony. Dalej wpisujemy URL strony.
Następnie klikamy przycisk "ustaw opcje" i w nowo otwartym oknie wybieramy zakładkę "ID przeglądarki" i w polu "Identyfikacja wklejamy: "Googlebot/2.1 (+http://www.google.com/bot.html)"
W polu "Stopka HTML" wybieramy opcję "none"
Następnie przechodzimy do zakładki "Poszukiwacz Pająk" i w polu "Spider" wybieramy "ignoruj reguły robots.txt"
Screeny konfiguracji:

HTTrack 2


HTTrack 1

HTTrack 3

Zapisujemy ustawienia i możemy rozpocząć pobieranie. Jak coś możemy jeszcze w zakładce zmienić ustawienia ograniczeń ponieważ domyślnie program pobiera z prędkością max 25kBit/s przy 4 połączeniach a więc przy większych stronach możemy długo sobie poczekać.
Jednak wciąż może być tak, że serwer będzie nas wyrzucał ze strony więc będzie konieczne odpalenie pobierania kilka razy poprzez opcję aktualizacji lustra.

Rozwiązanie problemu dzięki komentarzowi Voy_SSG_DialVoy_SSG_Dial na stronie dobrych programów.

© 2006-2017 by kondzio.info
Powered by Joomla!.
Designed by Globbers Themes modified by kondzio.info