Skip to content

RSScrawler erstellt .crawljobs für den JDownloader.

Notifications You must be signed in to change notification settings

Itsie/RSScrawler

 
 

Repository files navigation

RSScrawler - Version 2.0.9

Projekt von RiX

RSScrawler durchsucht MB/SJ nach in .txt Listen hinterlegten Titeln und reicht diese im .crawljob Format an JDownloader weiter.

Zum automatischen Lösen von Captchas empfiehlt sich 9kw.eu!

Den JDownloader betreffende Probleme (ReCaptcha benötigt Browserfenster, Link ist angeblich offline, etc.) müssen in dessen Entwicklerforum gelöst werden.

Um das Projekt zu erweitern muss entsprechender Code als Pull-Request eingereicht werden! Issues dienen nur der Fehlermeldung.

Credits:

dmitryint (im Auftrag von rix1337)

zapp-brannigan

Gutz-Pilz

bharnett

Bedanken:

Das Projekt nimmt keine Spenden an. Um sich für den aktuellen Stand von RSScrawler zu bedanken können Bitcoin gesendet werden. Features und Support werden hier nicht verkauft.

Danke!

TLDR:

  1. Aktiviere Ordnerüberwachung im JDownloader 2
  2. Installiere Python 2.7 und die Zusatzpakete: docopt, feedparser, BeautifulSoup, pycurl, lxml, requests, cherrypy
  3. Starte RSScrawler einmalig, dies erstellt den Einstellungen-Ordner inklusive aller benötigter Dateien
  4. Passe den jdownloaderpath, sowie port in der RSScrawler.ini an.
  5. Nutze RSScrawler. Alle Einstellungen sind nun unter dem gewählten Port und der IP des Rechners verfügbar!

Optional stehen fertige Builds für docker, Windows und Synology zur Verfügung!

Für macOS bitte beachten:

Die fehlenden Module müssen mit:

python -m pip install [MODULNAME] installiert werden

RSScrawler starten:

python RSScrawler.py führt RSScrawler aus

Startparameter:

--testlauf Einmalige Ausführung von RSScrawler

--port=<PORT> Legt den Port des Webservers fest

--jd-pfad=<JDPFAD> Legt den Pfad von JDownloader fest (nützlich bei headless-Systemen), diese Option darf keine Leerzeichen enthalten

--log-level=<LOGLEVEL> Legt fest, wie genau geloggt wird (CRITICAL, ERROR, WARNING, INFO, DEBUG, NOTSET )

Einstellungen:

Die RSScrawler.ini liegt im Einstellungen Ordner und wird (inklusive der Listen) beim ersten Start automatisch generiert. Danach ist der RSScrawler noch nicht einsatzbereit.

Zunächst muss der JDownloader-Pfad hinterlegt werden, ansonsten beendet sich RSScrawler automatisch mit einem Warnhinweis!

Der JDownloader-Pfad und der Port des Webserver kann daher per Startparameter festgelegt werden. Standardport ist 9090.

Sollte kein unmittelbarer Zugriff auf die RSScrawler.ini möglich sein, lässt sich RSScrawler mit den Parametern --jd-pfad und --port korrekt starten. Hierbei werden die entsprechenden Einträge der RSScrawler.ini ignoriert.

Für Pfade mit Leerzeichen kann nicht der --jd-pfad Parameter verwendet werden. Diese müssen direkt in der RSScrawler.ini hinterlegt werden.

Alle weiteren Einstellungen können nach Belieben über den Webserver angepasst werden und sind dort hinreichend erklärt. Ein direktes Bearbeiten der Einstellungen und Listen ist möglich, aber nicht empfehlenswert.

Releases:

Plattform Autor Status
Windows rix1337 Offiziell
Docker rix1337 Offiziell
Synology neutron666 Inoffiziell*

*eventuell nicht auf aktuellem Stand

About

RSScrawler erstellt .crawljobs für den JDownloader.

Resources

Stars

Watchers

Forks

Packages

No packages published

Languages

  • Python 100.0%