PTT推薦

[請益] 備份網站的技術?

看板Soft_Job標題[請益] 備份網站的技術? 作者
yobook
(@@)
時間推噓27 推:28 噓:1 →:45

花了很多P幣,跟時間再研究google跟備份網站

備份網站不是用多線程爬蟲技術嗎?

但是好像發現了,沒有這麼簡單

好像每個版,測試過,被備份的方式不同....

說簡單,但也不簡單

這類網站所依賴的技術,其實滿簡單的

但是PTT只要發文權限跟方式不改,永遠都一定會被備份

發文的那個瞬間,因為很多地方不能改變,只能發文後再改

所以,第一次的文章標題,還有發文者一定會被紀錄

本文可以修改,所以必須等第二次才能解決

想問一下,PTT備份網站,像是PTTWEB 所仰賴的技術.....

謝謝!

損失好多P幣跟時間,血淚,才得到這種結論.....

人腦真的比不上電腦QQ

--

※ PTT留言評論
※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 101.137.62.1 (臺灣)
PTT 網址

gasbomb10/09 10:03……有人看得懂這篇嗎?

yinxuanh10/09 10:08伸手文啊

loadingN10/09 10:09為什麼會損失p幣

Raymond071010/09 10:14https://github.com/PttCodingMan/PyPtt

PttLite10/09 11:08看標題進來因為是DB backup或snapshot結果是爬蟲...我快

PttLite10/09 11:08跟不上時代了..

qrtt110/09 11:55看不懂想要幹麻

wahaha27910/09 11:58看不懂在說什麼

yougigun10/09 12:02我也跟不上你的腦

brianhsu10/09 12:09請先閱讀「提問的智慧」,謝謝。

chocopie10/09 12:50先定義你要備份的內容是甚麼。

chocopie10/09 12:50是原本的內容一模一樣?還是只爬文章文字內容?

JimRoid10/09 12:55看標題我以為你是要問快照之類的

utdsml10/09 13:02原 po 應該是想問備份 PTT 裡面所有發推文紀錄的網站

moom5030210/09 13:05ctrl+S…?

eduishappy10/09 13:06我覺得PTT備份文章的網站真的好厲害喔!全都可以記錄

stupid031910/09 13:37偷取別人網站內容叫備份¿¿¿

geroge082010/09 13:43這就是工程師和客戶之間的思維差異

kyoe10/09 13:47只要格式固定,都可以被解析

flypaper10/09 14:31我程度太差看不懂 QQ

roccqqck10/09 15:18爬蟲作業自己寫欸 本來每個網站爬蟲都不一樣

roccqqck10/09 15:18都要修改

Olwen10/09 15:45明明是中文,我確聽不懂

PttLite10/09 15:54要用眼看

ChungLi556610/09 16:33看不懂的都沒有成為PM的資質

ChungLi556610/09 16:35客戶說的備份 要跟工程師說逆向工程才聽得懂

wave1et10/09 17:19ptt有個allpost版吧

PttLite10/09 18:12為什麼要對自己的網站做逆向工程

RINPE10/09 18:18沒有什麼是複製貼上解決不了的

sniper282410/09 19:252012做到現在發文發問還像完全不懂程式的外行著實厲害

bill020510/09 20:21對不起我還真的看不懂

aidansky098910/09 20:22這個表達能力不愧是工程師

OrzOGC10/09 20:22我看得懂,有人可以撿我去當PM嗎?QQ

viper970910/09 20:45看不懂想問什麼+1

pilor10/09 20:54我看得懂中文看不懂這篇文

boy7026310/09 21:34Ctrl+A+C+P

ChungLi556610/09 21:57偷別人網站內容 然後做出相似的東西放出來 他想知道

ChungLi556610/09 21:57那些網站怎麼辦到的

wulouise10/09 23:41沒講解決要解決什麼,一百遍都猜不透吧

BignoZe10/09 23:54看得懂 還好我有看完新上的通靈王

好吧~ 我直說1.是用甚麼技術做出的網站? 2.如何防止一發文就被備份 3.可以從備份網站刪文嗎?

Kazimir10/10 04:46公開網站要怎麼防止備份 你要他們刪文不然寫信去問看看R

寫了3封,沒人鳥~

qrtt110/10 08:31只有一開始就不存在的東西不會被備份

MarcoReus10/10 08:48反向思考 你可以發加密文

art110/10 09:38去跟 ptt 站方要求禁止來自這些網站的爬蟲

art110/10 09:38應該說請求才對

FantasyRyu10/10 09:50公開網站可以防爬蟲的話,那一開始你就發加密網站就好

daddy2910/10 10:19砍站

我連這網站的技術都不知道~ 要怎麼砍?

※ 編輯: yobook (101.137.139.78 臺灣), 10/10/2021 10:20:25

aa0669710/10 10:56公開網站 網站也不是你擁有的話 你單純發文沒辦法防吧

WJAider10/10 13:10哪篇啊? 我架個網站備份那篇,你想刪聯絡我一定刪

sppmg10/10 14:01我看唯一的問題應是:如何發文不留痕跡?

Apache10/10 15:30不要上網

ChungLi556610/10 17:08駭進去砍啊 不然就走法律途徑

MonyemLi10/10 17:59如果你是說刪除,那叫特權,工程師不能任意刪除的。公

MonyemLi10/10 17:59司主管授權維運工程師,政府公權力要求私人企業

longlongint10/10 18:28問netflix怎麼防止用直播截取卡把魷魚遊戲錄下來

longlongint10/10 18:28阿你文章就發出來了

chocopie10/10 19:041. 直接爬BBS、爬PTT網頁版、爬別人的爬蟲

chocopie10/10 19:042. 如何防止? 1. 發在有讀取權限的版 2. 不要發文

chocopie10/10 19:043. 檯面上方法有許多,檯面下方法不好說

mathrew10/10 19:27砍東西就是駭客行為啊,資訊資產保留的有一定的規範,

mathrew10/10 19:27不是你要砍就砍

Apache10/10 19:30你可以用GDPR去要求刪除

TakiDog10/12 12:58支離破碎的發言

realbout10/12 15:10這篇是三小....

andrew510610/12 18:11啊不就爬蟲

andrew510610/12 18:12之前試過在文章開頭加個HTML註解,有些備份網站就抓不

andrew510610/12 18:13到內文

andrew510610/12 18:15嘗試更改你的內文阿,或是故意加一些語法讓爬蟲程式錯

andrew510610/12 18:15亂認不出來

andrew510610/12 18:15爬蟲只能抓固定Pattern的東西吧

uglykidjoe10/22 17:24怎麼這麼多會通靈的人,真是太厲害了

cathychg02/09 12:48程式碼,資料庫 系統環境安裝啊

cathychg02/09 12:49資料庫比較麻煩 動態客戶資料要利用閒置時間備份。否則

cathychg02/09 12:49資料會漏的