没想到毕业之后还会折腾这破玩意。大学时用RGSS语言完成过一个类似的功能(虽然最近才知道它和Ruby语言有关),但没用Python写过。其实代码完全没难度,但这套系统很讨厌,它用.NET语言写成,出现最多的是页面是“当前访问人数过多,请稍后访问”,系统开发者最擅长的是制作登录界面,一口气做了5个(这得多闲啊……)。其中的default3.aspx不需要验证码。登录时必须带一个叫__VIEWSTATE参数,推测是系统自动生成,每隔一段时间会更换。
所以与其说我是分享Python代码,不如说我是分享正方系统的彩蛋来得准确。但好歹功能代码是Python的,总之都是非常基础的功能,包括:
- urllib和urllib2的使用
- 登录之后保存cookie
- 用BeautifulSoup(新版是bs4)分析页面内容
以上,直接贴代码:
import random
import urllib
import urllib2
import cookielib
from BeautifulSoup import BeautifulSoup
_xh = '学号'
_pw = '密码'
login_url = 'http://网址/default3.aspx'
#课表的网址
timetable_url = 'http://网址/xskbcx.aspx?xh=%s'% _xh
student_cookie = cookielib.CookieJar()
opener = urllib2.build_opener(urllib2.HTTPCookieProcessor(student_cookie)) # Login
data = '__VIEWSTATE='+VIEWSTATE+'&TextBox1='+_xh+'&TextBox2='+_pw+'&ddl_js=%D1%A7%C9%FA&Button1=+%B5%C7+%C2%BC+'
login_request = urllib2.Request(login_url, data, {
'Accept': 'text/html,application/xhtml+xml,application/xml;q=0.9,*/*;q=0.8',
'Accept-Charset': 'UTF-8,*;q=0.5',
'User-Agent': USER_AGENT,
'Content-Type': 'application/x-www-form-urlencoded',
'Connection': 'keep-alive',
'HOST': '网址',
'Origin': 'http://网址',
'Referer': 'http://网址/default3.aspx'})
opener.open(login_request, data)
html = opener.open(timetable_url).read()
获得html之后用BeautifulSoup解析,先找到table标签,然后通过id获取DOM:
soup = BeautifulSoup(html, fromEncoding='gbk')
table = soup.find("table", {"id": "Table1"})
搞定了,欢迎各位以此为基础制作各种选课程序。= =v
转载请注明:爱开源 » 用Python登录正方系统获取课表