Semalt專家建議–如何抓取網站

ScrapBook是一個著名的Firefox擴展,具有增強的頁面保存,筆記,書籤和剪貼簿功能。使用ScrapBook,您可以輕鬆地將網頁保存在本地計算機系統上。但是,您無法從另一台計算機設備或智能手機訪問下載的文件。 ScrapBook擴展程序可以與其他同步服務結合使用,這些服務可以同步ScrapBook存儲數據的文件夾。

此Firefox擴展程序的開發:

Danny Linn在Murota實驗室開發了ScrapBook,並在Extend Firefox Competition中獲得了多個獎項。它的一些最新版本是ScrapBook Plus,ScrapBook Lite,ScrapBook X和ScrapBook Plus 2,它們都具有交互功能。

使用ScrapBook下載整個網站:

您是否要下載整個或部分網站以供離線使用? ScrapBook是唯一幫助將不同網頁保存到硬盤的Firefox擴展。它輕巧,快速,並且可以完美地緩存站點的本地副本。此外,ScrapBook支持多種語言,並已通過不同的CSS樣式和圖形進行了測試。此擴展名可用於組織數據和編輯收集的網頁。其HTML /文本編輯功能類似於Opera的Notes。

安裝Firefox擴展程序:

如果您正在運行最新版本的Firefox(v33),則必須調整其設置才能正確使用ScrapBook。默認情況下,其圖標不會顯示在任何地方,因此您必須右鍵單擊網頁,然後將按鈕手動添加到工具欄。下一步,您需要單擊“自定義”按鈕,並且ScrapBook圖標將在左側顯示。

使用ScrapBook下載站點:

ScrapBook圖標可見後,您現在可以使用它來下載整個網站。首先,您必須右鍵單擊該網站,然後選擇“另存為”或“另存為”按鈕。 ScrapBook將開始將樣式,文本和圖像下載到您的硬盤中。

WinHTTrack – ScrapBook的替代品

如果您不使用Mozilla Firefox,但仍想將整個網站下載到您的計算機上,則可以選擇WinHTTrack。該程序使我們可以將網站下載到本地計算機,並適當地安排下載的文檔。 WinHTTrack也可以更新現有文件並恢復中斷的下載。它可以通過不同的過濾器和選項進行配置,並且具有易於使用的界面。

WinHTTrack使用特定的Web搜尋器來下載站點。由於漫遊器排除協議,網站的某些部分可能無法正確下載。因此,您將不得不禁用該程序並重新啟動窗口。 WinHTTrack遵循使用基本HTML和JavaScript代碼生成的鏈接。它無法處理複雜的鏈接,也無法正確下載動態網站。

結論:

WinHTTrack和ScrapBook都有各自的優缺點。 WinHTTrack與幾乎所有的Web瀏覽器兼容,而ScrapBook僅與Mozilla Firefox兼容。但是,兩個擴展都需要大量空間。因此,您應該確保硬盤上有足夠的可用空間。