Pirater le web sans navigateur

C’est un problème traditionnel. Vous souhaitez utiliser des données pour utiliser votre programme mais c’est sur une page Web. Certains sites ont bien sûr une API, cependant, vous êtes seul. Vous pouvez tonne la page entière à travers HTTP et analysez-la. Ou vous pouvez utiliser certains outils pour “gratter” le site. Une méthode fascinante pour le faire est WOOB – Web en dehors des navigateurs.

Le système utilise une série de backends sur mesure sur des sites spécifiques. Il y a une collection de backends officiels aussi bien que vous pouvez également produire votre propre. Lorsque vous avez un bilan, vous pouvez le configurer et l’utiliser à partir de Python. Voici un exemple de découverte d’un solde de compte bancaire:

>>> de WOOB.CORE IMPORT WOOB
>>> de woob.capabilities.bank Import Capbank
>>> w = woob ()
>>> W.Load_Backends (CAPBANK)
{‘Societegenerale’: , CreditMutuel ‘: }
>>> PPRINT (liste (w.iter_accounts ()))
[,
,
]
>>> ACC = Suivant (iTER (w.iter_accountsounts ()))
>>> ap.balance
Décimal (’87 .32 ‘)
La liste des backends proposés est impressionnante, mais éventuellement, vous voudrez produire vos propres modules. Heureusement, il y a beaucoup de documentation sur la façon de faire exactement comment faire cela. Le cadre vous permet de publier des données sur le site et a rapidement vérifié les résultats. Chaque backend a également un test qui peut trouver si une modification du site enfreint le code, qui est un problème typique avec de tels schémas.

Nous n’avons pas vu de backend hackaday. aussi mauvais. Il existe toutefois de nombreux exemples d’applications, à la fois basés sur la console et à utiliser QT. Par exemple, vous pouvez parcourir des films, gérer des recettes ou des sites de rencontres.

Bien sûr, il existe de nombreuses méthodes possibles à ce problème. Peut-être que vous avez besoin de découvrir quand le prochain train quitte.

ava
category

Leave a Comment

Your email address will not be published. Required fields are marked *