一.項目背景
在之前文章構(gòu)建Cookie池(一)我們介紹了如何全自動化利用Selenium構(gòu)建Cookie池。但是在實際開發(fā)中,我們經(jīng)常會遇到反爬措施,成功登錄網(wǎng)頁的情況也不常見,比如會遇到圖形驗證碼和滑塊等,破解時也比較麻煩,比較好的方法就是我們手動協(xié)助登錄,也就是半自動化式獲取Cookie,這也相對來說是一個比較萬能的方法。
本次項目我們爬取的目標網(wǎng)址還是閃職網(wǎng),一個專門為爬蟲工程師進行練習的網(wǎng)址,也
在此非常感謝網(wǎng)站后臺維護人員辛勤付出,網(wǎng)址為:http://shanzhi.spbeen.com/,從
中可以看出Cookies有csrftoken和shanzhi_kmer以及它們各自對應(yīng)的值
二.實現(xiàn)過程
from selenium import webdriver
import time
import json
#用戶名
users=[
{'username':'test123456','password':'test123456'},
{'username':'wfq123','password':'123'},
{'username':'cauwfq','password':'cauwfq'},
{'username':'cauwfq1234','password':'cauwfq1234'}
]
#程序?qū)㈩A處理內(nèi)容全部處理好
#瀏覽器等著用戶來處理,比如登錄
#用戶處理的同時,程序一直在監(jiān)聽
#直到用戶直接關(guān)閉瀏覽器,程序發(fā)生異常,繼續(xù)往下執(zhí)行
def wait_cookie(driver):
#循環(huán)監(jiān)聽
while True:
try:
#獲取cookies
cookie_list=driver.get_cookies()
#獲取cookie值
cookie_dict={ck['name']:ck['value'] for ck in cookie_list}
#輸出cookie值
print(cookie_dict)
except:
#寫入文件
with open('./cookies_1.txt', 'a+', encoding='utf8') as f:
#寫入字典
f.write(json.dumps(cookie_dict))
#寫入換行符
f.write('n')
break
#睡眠3s
time.sleep(3)
#登錄網(wǎng)址
def login(username,password):
#初始化url
url='http://shanzhi.spbeen.com/login/'
#初始化webdriver
driver=webdriver.Chrome()
#最大化窗口
driver.maximize_window()
#請求url
driver.get(url)
#用戶名輸入框
username_input=driver.find_element_by_xpath('//*[@id="username"]')
#發(fā)送用戶名
username_input.send_keys(username)
#休眠1秒鐘
time.sleep(1)
#密碼輸入框
password_input=driver.find_element_by_xpath('//*[@id="MemberPassword"]')
#發(fā)送密碼
password_input.send_keys(password)
#獲取cookie
wait_cookie(driver)
if __name__ == '__main__':
#遍歷每個用戶
for user in users:
#登錄獲取cookie
login(user['username'],user['password'])
聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學習之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。
舉報投訴
-
開發(fā)
+關(guān)注
關(guān)注
0文章
360瀏覽量
40770 -
Cookie
+關(guān)注
關(guān)注
0文章
30瀏覽量
10390 -
全自動化
+關(guān)注
關(guān)注
0文章
8瀏覽量
1626
發(fā)布評論請先 登錄
相關(guān)推薦
php中Cookie及其使用
,但是對于絕大多數(shù)的網(wǎng)絡(luò)用戶來說還是傾向于接受Cookie的。因此,我們盡可以放心地使用Cookie技術(shù)來開發(fā)我們的WEB頁面。 2)Cookie是怎樣工作的? 要了解
發(fā)表于 01-11 09:25
Cookie是怎樣工作的?
2"); 接收和處理Cookie PHP對Cookie的接收和處理的支持非常好,是完全自動的,跟FORM變量的原則一樣,特別簡單。比如設(shè)置一個名為MyCookier的Cookie
發(fā)表于 01-11 09:32
cookie是什么意思
cookie是什么意思什么是Cookie? 按照Netscape官方文檔中的定義,Cookie是在HTTP協(xié)議下,服務(wù)器或腳本可以維護客戶工作站上信息的一種方式。Cookie 是由
發(fā)表于 01-11 21:26
COOKIE和SESSION會話機制
網(wǎng)站的老客戶,如果是,它就會自動推送一些你喜歡的內(nèi)容。COOKIE信息,是靠瀏覽器來進行存儲、記錄的,所以,有的時候,我們清除COOKIE信息之后,這些內(nèi)容就不再存在了!2.為什么要使用COO
發(fā)表于 07-03 09:13
cookie和session的不同作用
Bean乃至任何Java類,對象等,運用起來十分便當。能夠把Session看做是一個Java容器類。2. 隱私策略的不同Cookie存儲在客戶端閱讀器中,對客戶端是可見的,客戶端的一些程序可能會窺探
發(fā)表于 01-09 17:39
Cookie和Session的區(qū)別總結(jié)
Bean乃至任何Java類,對象等,運用起來十分便當。能夠把Session看做是一個Java容器類。2. 隱私策略的不同Cookie存儲在客戶端閱讀器中,對客戶端是可見的,客戶端的一些程序可能會窺探
發(fā)表于 01-10 15:11
構(gòu)建一個Cookie JAR激情時鐘
描述Cookie JAR激情時鐘我想重現(xiàn)幾年前我最古老的項目之一,當時我建造了一個類似的時鐘。只是這一次,我想應(yīng)用不同的技術(shù)并提出更好的設(shè)計。這個時鐘將滾動瀏覽一系列浪漫消息,并且每小時顯示一條
發(fā)表于 08-01 06:44
什么是Cookie?
什么是Cookie?
按照Netscape官方文檔中的定義,Cookie是在HTTP協(xié)議下,服務(wù)器或腳本可以維護客戶工作站上信息的一種方式。Cooki
發(fā)表于 01-11 09:27
?2254次閱讀
網(wǎng)絡(luò)Cookie工作原理
網(wǎng)絡(luò)Cookie工作原理
引言
雖然大多數(shù)網(wǎng)絡(luò)Cookie使用起來相當簡單,但是它們也有自己獨特的原理。
發(fā)表于 08-04 08:32
?4115次閱讀
Cookie數(shù)據(jù)是如何移動的?
Cookie數(shù)據(jù)是如何移動的?
Cookie數(shù)據(jù)只是網(wǎng)站存儲在您的硬盤上的一個名稱/值對。所有Cookie數(shù)據(jù)都是這樣。網(wǎng)站存儲此數(shù)據(jù),并在以后接收此數(shù)據(jù)。一個網(wǎng)站只能接收其
發(fā)表于 08-04 08:33
?891次閱讀
網(wǎng)站是如何使用Cookie的?
網(wǎng)站是如何使用Cookie的?
Cookie由于為使用網(wǎng)站的人解決了一個大問題而逐漸發(fā)展起來。從廣義上說,Cookie允許網(wǎng)站在計算機上存儲狀態(tài)信息,這些信息可讓網(wǎng)站記住瀏
發(fā)表于 08-04 08:33
?1625次閱讀
cookie的作用
cookie也可以叫做瀏覽器緩存,主要就是為了辨別用戶的資料,有兩種類型分別是會話cookie和持久cookie。本文主要詳細闡述cookie的作用以及
cookie和session區(qū)別
本視頻主要詳細闡述了cookie和session區(qū)別,cookie數(shù)據(jù)存放在客戶的瀏覽器上,session數(shù)據(jù)放在服務(wù)器上。cookie不是很安全,別人可以分析存放在本地的COOKIE
如何構(gòu)建Cookie池-1
由于http協(xié)議是無狀態(tài)的協(xié)議,簡單理解為如果客戶端向服務(wù)器發(fā)送兩次請求,這
兩次請求是獨立的,,也就是說服務(wù)器根本不知道是同一個客戶端發(fā)送過來的請求。所
以為了維護客戶端的請求狀態(tài),Cookie技術(shù)應(yīng)用而生。
評論