下面分享一個使用Python進行網站模擬登陸的小例子。
原理
使用Cookie技術,繞開網站登錄驗證。要使用到cookielib庫。流程:
創建一個保存Cookie的容器,可選的有CookieJar,FileCookieJar,MozillaCookieJar,LWPCookieJar.其相互之間的關系是CookieJar —-派生—->FileCookieJar —-派生—–>MozillaCookieJar和LWPCookieJar.
然后創建一個處理Cookie的處理器handler.通過urllib2.HTTPCookieProcessor(cookie)即可
創建一個用于開啟網站的opener。即可。這個opener相比于urllib2.urlopen方法更為普通一點而已。opener = urllib2.build_opener(handler)。
然后我們就可以正常的使用opener來訪問網絡了。
小案例
實現的功能是模擬登錄到大連理工大學的教務網站。代碼如下:
# coding:UTF-8
import urllib,urllib2,cookielib
filename = r'F:\pachong\gaoqing\dlutcookie.txt'
# show cookie and save to local
cookie = cookielib.MozillaCookieJar()
handler = urllib2.HTTPCookieProcessor(cookie)
opener = urllib2.build_opener(handler)
# 記得使用urllib模塊進行參數的encode
postdata = urllib.urlencode({
# 哈哈,本宮不給你們我的賬號╭(╯^╰)╮
'zjh':'xxxxxxxxx',
'mm':'XXXXXX'
})
# 登陸到教務系統的url
url = 'http://zhjw.dlut.edu.cn/loginAction.do'
# 開始進行模擬登陸,并把cookie保存到變量
response = opener.open(url,postdata)
cookie.save(filename,ignore_discard=True,ignore_expires=True)
# 打印一下獲得的cookie信息吧
for item in cookie:
item.name + ' = ' + item.value
# 利用cookie訪問另一個網址 登陸到個人成績的URL
course_url='http://zhjw.dlut.edu.cn/xkAction.do?actionType=6'
course_header={
'user-agent': 'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/46.0.2486.0 Safari/537.36 Edge/13.10586',
'referer':'http://zhjw.dlut.edu.cn/menu/s_main.jsp'
}
result = opener.open(course_url)
print result.read()
運行結果

總結
其實對于模擬登陸而言,第一次的登陸就是為了獲取那個cookie數據。然后通過我們創建的opener來完成接下來我們要進行的關鍵的進一步的操作。我們需要理解的就只是那個cookie的使用的流程就行了。