- N +

爬蟲軟件抓取數(shù)據(jù)違法嗎,爬蟲如何抓取網(wǎng)頁(yè)數(shù)據(jù)

本篇文章給大家談?wù)勁老x軟件抓取數(shù)據(jù)違法嗎,以及爬蟲如何抓取網(wǎng)頁(yè)數(shù)據(jù)對(duì)應(yīng)的知識(shí)點(diǎn),文章可能有點(diǎn)長(zhǎng),但是希望大家可以閱讀完,增長(zhǎng)自己的知識(shí),最重要的是希望對(duì)各位有所幫助,可以解決了您的問題,不要忘了收藏本站喔。

網(wǎng)絡(luò)爬蟲可以抓取用戶的信息嗎屬于違法行為嗎

利用網(wǎng)絡(luò)爬蟲抓取用戶的信息,早已不是什么新鮮事了,近日魔蝎科技、新顏科技、公信寶等大數(shù)據(jù)公司先后被查,都因“爬蟲業(yè)務(wù)”有關(guān),從而產(chǎn)生數(shù)據(jù)竊取、泄露、濫用和隱私安全等問題。

網(wǎng)絡(luò)爬蟲,作為一種技術(shù),本身不存在違法的問題,關(guān)鍵是用爬蟲爬什么,以及怎么爬。

不合規(guī)使用爬蟲抓取數(shù)據(jù),就目前的公開的判例,根據(jù)不同的情況,有可能觸犯

侵犯公民個(gè)人信息罪非法獲取計(jì)算機(jī)信息系統(tǒng)數(shù)據(jù)罪侵犯著作權(quán)罪非法侵入計(jì)算機(jī)信息系統(tǒng)罪

詳情請(qǐng)參看鄧世運(yùn)律師的往期文章

「刑事律師解讀」爬蟲有四大法律風(fēng)險(xiǎn),抓數(shù)需謹(jǐn)慎

自己寫的爬蟲,抓取網(wǎng)上收費(fèi)的內(nèi)容算不算違法

收費(fèi)沒關(guān)系關(guān)鍵是版權(quán),如果有文檔有版權(quán)你沒授權(quán)肯定違法了,你違法了不一定會(huì)告你

利用網(wǎng)絡(luò)爬蟲獲取數(shù)據(jù)構(gòu)成犯罪嗎

爬取網(wǎng)站提供接口的公開信息不違法,如天氣等等。如果涉及公民隱私類信息,建議不要違法爬取更加不要用來謀利,國(guó)家立法命令禁止這類行為!雖然目前大部分公民信息已經(jīng)遭到泄露,但請(qǐng)至少?gòu)奈覀冏约鹤銎穑灰匀搜z頭!

爬蟲技術(shù)違法嗎

先說結(jié)論,技術(shù)無罪,有罪的是人。爬蟲技術(shù)本身是不違法的,但是如果利用爬蟲技術(shù)做損害他人利益的事情就是違法的了。

具體的法律條文,我也記不大清了,目前對(duì)于爬蟲技術(shù)的使用界限沒有一個(gè)特別明確的規(guī)定,按照我之前咨詢律師得到答案,大概就是關(guān)乎這三個(gè)方面:采集途徑、采集行為、使用目的。

通過什么途徑爬取數(shù)據(jù),這個(gè)是最需要重視的一點(diǎn)。總體來說,未公開、未經(jīng)許可、且?guī)в忻舾行畔⒌臄?shù)據(jù),不管是通過什么渠道獲得,都是一種不合法的行為。

采集行為上使用技術(shù)手段應(yīng)該懂得克制,一些容易對(duì)服務(wù)器和業(yè)務(wù)造成干擾甚至破壞的行為,容易違法

還有就是使用目的,就算你通過合法途徑采集的數(shù)據(jù),如果對(duì)數(shù)據(jù)沒有正確的使用,同樣會(huì)存在不合法的行為。一種情況是公開收集的數(shù)據(jù),但沒有遵循之前告知的使用目的。比如有些網(wǎng)站上標(biāo)明內(nèi)容不得用于商業(yè)行為,還有未經(jīng)授權(quán)不得轉(zhuǎn)載的,些都是有法律明文保護(hù),所以要注意使用。

最后,結(jié)合實(shí)際情況,給幾點(diǎn)建議吧

1、爬蟲訪問頻次要控制,別把對(duì)方服務(wù)器搞崩潰了

雖然你爬取的信息都是公開的,也不涉及公民隱私,爬取的數(shù)據(jù)也不用于違法獲利,只是自己弄著玩,但是如果你的爬蟲太瘋狂了,一分鐘請(qǐng)求1萬次,導(dǎo)致對(duì)方服務(wù)器應(yīng)接不暇,不能處理正常業(yè)務(wù)了,對(duì)不起,你這種屬于違法行為,這種爬蟲等同于進(jìn)行黑客攻擊了,你讓人家不能正常工作了,損害了對(duì)方的利益

2、涉及到個(gè)人隱私的信息你不能爬

其實(shí)這很好理解,你希望你自己的電話號(hào),身份證號(hào),家庭住址,工作單位,行蹤軌跡這些隱私信息被別人用爬蟲抓取么?當(dāng)然不希望,別人抓了你的這些信息,你肯定想去報(bào)警對(duì)不對(duì),讓警察去抓那個(gè)壞蛋,ok,你不要去做那個(gè)壞蛋。

3、突破網(wǎng)站的反爬措施,后果很嚴(yán)重

正規(guī)的網(wǎng)站都會(huì)在根目錄下放置robots.txt,這里就規(guī)定了哪些能爬,哪些不能爬,誰可以爬,比如知乎的robots.txt,人家希望搜索引擎來爬它,其他的,一概不接受

不過呢,知乎并沒有做特別嚴(yán)厲的反爬措施,這就是說,如果你偷偷的爬一點(diǎn)東西,不影響它的正常服務(wù),它也懶得找你麻煩,但對(duì)于那種反爬特別嚴(yán)重的,例如淘寶,你最好別去爬,如果你真的利用你的高智商突破了淘寶的反爬措施,那么恭喜你,你已經(jīng)違法了

4、不要用爬取的數(shù)據(jù)做不正當(dāng)競(jìng)爭(zhēng)

比如你把大眾點(diǎn)評(píng)的評(píng)論數(shù)據(jù)都爬下來了,然后自己搞了一個(gè)xx點(diǎn)評(píng),這肯定不行,人家辛辛苦苦的積累的數(shù)據(jù),你輕輕松松的弄下來,直接拿來主義,跟人家搞競(jìng)爭(zhēng),你不違法誰違法。

5、付費(fèi)內(nèi)容,你不要抓

既然是付費(fèi)內(nèi)容,說明這東西價(jià)值很高,付費(fèi)才能看,你弄下來了,你想干啥?你私自傳播,就對(duì)網(wǎng)站造成了潛在損失。

6、最后一條,突破網(wǎng)站反爬措施的代碼,最好不要上傳到網(wǎng)上

你技術(shù)很牛逼,能突破網(wǎng)站的反爬措施,你把這些代碼發(fā)布到網(wǎng)上,比如github,你自己沒做啥壞事,可是想做壞事的人利用了你的代碼,入侵了網(wǎng)站,那么,這種情況下,你也是有責(zé)任的,這個(gè)聽起來有點(diǎn)冤,但確實(shí)存在這樣的風(fēng)險(xiǎn),所以,最好還是不要這么干

為什么爬蟲犯法

如果爬蟲程序采集到公民的姓名、身份證件號(hào)碼、通信通訊聯(lián)系方式、住址、賬號(hào)密碼、財(cái)產(chǎn)狀況、行蹤軌跡等個(gè)人信息,并將之用于非法途徑的,則肯定構(gòu)成非法獲取公民個(gè)人信息的違法行為。

也就是說你爬蟲爬取信息沒有問題,但不能涉及到個(gè)人的隱私問題,如果涉及了并且通過非法途徑收益了,那肯定是違法行為。

另外,還有下列三種情況,爬蟲有可能違法,嚴(yán)重的甚至構(gòu)成犯罪:

爬蟲程序規(guī)避網(wǎng)站經(jīng)營(yíng)者設(shè)置的反爬蟲措施或者破解服務(wù)器防抓取措施,非法獲取相關(guān)信息,情節(jié)嚴(yán)重的,有可能構(gòu)成“非法獲取計(jì)算機(jī)信息系統(tǒng)數(shù)據(jù)罪”。

爬蟲程序干擾被訪問的網(wǎng)站或系統(tǒng)正常運(yùn)營(yíng),后果嚴(yán)重的,觸犯刑法,構(gòu)成“破壞計(jì)算機(jī)信息系統(tǒng)罪”

爬蟲采集的信息屬于公民個(gè)人信息的,有可能構(gòu)成非法獲取公民個(gè)人信息的違法行為,情節(jié)嚴(yán)重的,有可能構(gòu)成“侵犯公民個(gè)人信息罪”。

關(guān)于本次爬蟲軟件抓取數(shù)據(jù)違法嗎和爬蟲如何抓取網(wǎng)頁(yè)數(shù)據(jù)的問題分享到這里就結(jié)束了,如果解決了您的問題,我們非常高興。

返回列表
上一篇:
下一篇: