一些網站備份工具
警告
本文章最後更新December 29, 2018,文中內容可能已經過時了,有疑慮請當成參考。
目錄
openwayback(軟體)
http://web.archive.bibalex.org/web/
上面的網址與wayback machine似乎是有相關的,而這也就是wayback machine的開源版,架構應該是相同的,只不過人家弄得更精緻就是了,而且這要自己架設,詳細的教學他們的github都有寫上去了,只不過自己是英文苦手,從我另外發的文看就知道,我只是弄個半成品之類的東西而已。
wayback machine(網站)
這應該是最多人使用以及保存資料最齊全,畢竟有主動式網路爬蟲,至2018年底止,已有3440億個網頁了,許多網站根本不須額外抓取,就能在該網站中找到歷史頁面了,只可惜的是一些小眾的網頁大概永遠都不會爬到,不過使用的人多的話也許會有人會保存過,還有一些使用flash製作的網頁是無法抓取、保留備份的。
Archive.is(網站)
類似wayback machine的一款網站,不過強大的程度比不上wayback machine,畢竟知名度好像沒有wayback machine高,許多網站沒有找到紀錄,而且有些網站會變形
webrecorder(網站)
Perma.cc(網站)
這兩個我倒是連聽都沒聽過,使用之後還是覺得wayback machine比較好用,webrecorder沒有登入的話網頁只會保存90分鐘,不過webrecorder可以擷取flash頁面倒是比較特別。
而Perma.cc則需要登入才可以進行紀錄,我就沒有特別測試了。
HTTrack Website Copier(軟體)
一個英文版的砍站軟體,類似離線瀏覽,直接把網站頁面下載到電腦上,但是需要稍微設定一下才會比較好用,而有些html網站不知道為何無法下載……。