Python Requêtes et sessions persistantes

Question

J'utilise le module demandes (version 0.10.0 avec Python 2.5). J'ai découvert comment soumettre des données à un formulaire de connexion sur un site Web et récupérer la clé de session, mais je ne vois pas de manière évidente d'utiliser cette clé de session dans les requêtes suivantes. Quelqu'un peut-il compléter les Ellipsis dans le code ci-dessous ou suggérer une autre approche?

>>> import requests >>> login_data = {'formPosted':'1', 'login_email':'me@example.com', 'password':'pw'} >>> r = requests.post('https://localhost/login.py', login_data) >>> >>> r.text u'You are being redirected <a href="profilePage?_ck=1349394964">here</a>' >>> r.cookies {'session_id_myapp': '127-0-0-1-825ff22a-6ed1-453b-aebc-5d3cf2987065'} >>> >>> r2 = requests.get('https://localhost/profile_data.json', ...)

Anuj Gupta · Accepted Answer

Vous pouvez facilement créer une session persistante en utilisant:

s = requests.session()

Après cela, continuez avec vos demandes comme vous le feriez:

s.post('https://localhost/login.py', login_data) #logged in! cookies saved for future requests. r2 = s.get('https://localhost/profile_data.json', ...) #cookies sent automatically! #do whatever, s will keep your cookies intact :)

Pour plus d'informations sur les sessions: http://docs.python-requests.org/en/latest/user/advanced/#session-objects

Morten Jensen · Answer

Découvrez ma réponse à cette question similaire:

python: urllib2 comment envoyer un cookie avec une demande urlopen

import urllib2 import urllib from cookielib import CookieJar cj = CookieJar() opener = urllib2.build_opener(urllib2.HTTPCookieProcessor(cj)) # input-type values from the html form formdata = { "username" : username, "password": password, "form-id" : "1234" } data_encoded = urllib.urlencode(formdata) response = opener.open("https://page.com/login.php", data_encoded) content = response.read()

MODIFIER:

Je vois que j'ai reçu quelques votes négatifs pour ma réponse, mais aucun commentaire explicatif. Je suppose que c'est parce que je parle des bibliothèques urllib au lieu de requests. Je le fais parce que le PO demande de l'aide pour requests ou que quelqu'un propose une autre approche.

DomTomCat · Answer

les autres réponses aident à comprendre comment maintenir une telle session. De plus, je souhaite fournir une classe qui maintient la session maintenue sur différentes exécutions d'un script (avec un fichier cache). Cela signifie qu'une "connexion" appropriée n'est effectuée que lorsque cela est nécessaire (timout ou aucune session n'existe dans le cache). En outre, il prend en charge les paramètres de proxy lors des appels ultérieurs à "obtenir" ou à "publier".

Il est testé avec Python3.

Utilisez-le comme base pour votre propre code. Les extraits suivants sont publiés avec GPL v3

import pickle import datetime import os from urllib.parse import urlparse import requests class MyLoginSession: """ a class which handles and saves login sessions. It also keeps track of proxy settings. It does also maintine a cache-file for restoring session data from earlier script executions. """ def __init__(self, loginUrl, loginData, loginTestUrl, loginTestString, sessionFileAppendix = '_session.dat', maxSessionTimeSeconds = 30 * 60, proxies = None, userAgent = 'Mozilla/5.0 (Windows NT 6.1; WOW64; rv:40.0) Gecko/20100101 Firefox/40.1', debug = True, forceLogin = False, **kwargs): """ save some information needed to login the session you'll have to provide 'loginTestString' which will be looked for in the responses html to make sure, you've properly been logged in 'proxies' is of format { 'https' : 'https://user:pass@server:port', 'http' : ... 'loginData' will be sent as post data (dictionary of id : value). 'maxSessionTimeSeconds' will be used to determine when to re-login. """ urlData = urlparse(loginUrl) self.proxies = proxies self.loginData = loginData self.loginUrl = loginUrl self.loginTestUrl = loginTestUrl self.maxSessionTime = maxSessionTimeSeconds self.sessionFile = urlData.netloc + sessionFileAppendix self.userAgent = userAgent self.loginTestString = loginTestString self.debug = debug self.login(forceLogin, **kwargs) def modification_date(self, filename): """ return last file modification date as datetime object """ t = os.path.getmtime(filename) return datetime.datetime.fromtimestamp(t) def login(self, forceLogin = False, **kwargs): """ login to a session. Try to read last saved session from cache file. If this fails do proper login. If the last cache access was too old, also perform a proper login. Always updates session cache file. """ wasReadFromCache = False if self.debug: print('loading or generating session...') if os.path.exists(self.sessionFile) and not forceLogin: time = self.modification_date(self.sessionFile) # only load if file less than 30 minutes old lastModification = (datetime.datetime.now() - time).seconds if lastModification < self.maxSessionTime: with open(self.sessionFile, "rb") as f: self.session = pickle.load(f) wasReadFromCache = True if self.debug: print("loaded session from cache (last access %ds ago) " % lastModification) if not wasReadFromCache: self.session = requests.Session() self.session.headers.update({'user-agent' : self.userAgent}) res = self.session.post(self.loginUrl, data = self.loginData, proxies = self.proxies, **kwargs) if self.debug: print('created new session with login' ) self.saveSessionToCache() # test login res = self.session.get(self.loginTestUrl) if res.text.lower().find(self.loginTestString.lower()) < 0: raise Exception("could not log into provided site '%s'" " (did not find successful login string)" % self.loginUrl) def saveSessionToCache(self): """ save session to a cache file """ # always save (to update timeout) with open(self.sessionFile, "wb") as f: pickle.dump(self.session, f) if self.debug: print('updated session cache-file %s' % self.sessionFile) def retrieveContent(self, url, method = "get", postData = None, **kwargs): """ return the content of the url with respect to the session. If 'method' is not 'get', the url will be called with 'postData' as a post request. """ if method == 'get': res = self.session.get(url , proxies = self.proxies, **kwargs) else: res = self.session.post(url , data = postData, proxies = self.proxies, **kwargs) # the session has been updated on the server, so also update in cache self.saveSessionToCache() return res

Un extrait de code pour utiliser la classe ci-dessus peut ressembler à ceci:

if __== "__main__": # proxies = {'https' : 'https://user:pass@server:port', # 'http' : 'http://user:pass@server:port'} loginData = {'user' : 'usr', 'password' : 'pwd'} loginUrl = 'https://...' loginTestUrl = 'https://...' successStr = 'Hello Tom' s = MyLoginSession(loginUrl, loginData, loginTestUrl, successStr, #proxies = proxies ) res = s.retrieveContent('https://....') print(res.text) # if, for instance, login via JSON values required try this: s = MyLoginSession(loginUrl, None, loginTestUrl, successStr, #proxies = proxies, json = loginData)

dm03514 · Answer

La documentation indique que get prend en compte un argument optionnel cookies vous permettant de spécifier les cookies à utiliser:

des docs:

>>> url = 'http://httpbin.org/cookies' >>> cookies = dict(cookies_are='working') >>> r = requests.get(url, cookies=cookies) >>> r.text '{"cookies": {"cookies_are": "working"}}'

http://docs.python-requests.org/en/latest/user/quickstart/#cookies

Jim Chertkov · Answer

Après avoir essayé toutes les réponses ci-dessus, j’ai constaté que l’utilisation de RequestsCookieJar au lieu du CookieJar habituel pour les demandes ultérieures corrigeait mon problème.

import requests import json authUrl = 'https://whatever.com/login' #The subsequent url testUrl = 'https://whatever.com/someEndpoint' #Whatever you are posting login_data = {'formPosted':'1', 'login_email':'me@example.com', 'password':'pw'} #The auth token or any other data that we will recieve from the authRequest. token = '' # Post the loginRequest loginRequest = requests.post(authUrl,login_data) print loginRequest.text # Save the request content to your variable. In this case I needed a field called token. token = str(json.loads(loginRequest.content)['token']) print token # Verify successfull login print loginRequest.status_code #Create your RequestsCookieJar for your subsequent requests and add the cookie jar = requests.cookies.RequestsCookieJar() jar.set('LWSSO_COOKIE_KEY', token) #Execute your next request(s) with the RequestCookieJar set r = requests.get(testUrl, cookies=jar) print(r.text) print(r.status_code)

NiL · Answer

extrait pour récupérer des données JSON, protégé par mot de passe

import requests username = "my_user_name" password = "my_super_secret" url = "https://www.my_base_url.com" the_page_i_want = "/my_json_data_page" session = requests.Session() # retrieve cookie value resp = session.get(url+'/login') csrf_token = resp.cookies['csrftoken'] # login, add referer resp = session.post(url+"/login", data={ 'username': username, 'password': password, 'csrfmiddlewaretoken': csrf_token, 'next': the_page_i_want, }, headers=dict(Referer=url+"/login")) print(resp.json())

Dasitha Abeysinghe · Answer

Cela fonctionnera pour vous en Python;

# Call JIRA API with HTTPBasicAuth import json import requests from requests.auth import HTTPBasicAuth JIRA_EMAIL = "****" JIRA_TOKEN = "****" BASE_URL = "https://****.atlassian.net" API_URL = "/rest/api/3/serverInfo" API_URL = BASE_URL+API_URL BASIC_AUTH = HTTPBasicAuth(JIRA_EMAIL, JIRA_TOKEN) HEADERS = {'Content-Type' : 'application/json;charset=iso-8859-1'} response = requests.get( API_URL, headers=HEADERS, auth=BASIC_AUTH ) print(json.dumps(json.loads(response.text), sort_keys=True, indent=4, separators=(",", ": ")))