RSScrawler - Version 2.0.9

Projekt von RiX

RSScrawler durchsucht MB/SJ nach in .txt Listen hinterlegten Titeln und reicht diese im .crawljob Format an JDownloader weiter.

Zum automatischen Lösen von Captchas empfiehlt sich 9kw.eu!

Den JDownloader betreffende Probleme (ReCaptcha benötigt Browserfenster, Link ist angeblich offline, etc.) müssen in dessen Entwicklerforum gelöst werden.

Um das Projekt zu erweitern muss entsprechender Code als Pull-Request eingereicht werden! Issues dienen nur der Fehlermeldung.

Credits:

dmitryint (im Auftrag von rix1337)

zapp-brannigan

Gutz-Pilz

bharnett

Bedanken:

Das Projekt nimmt keine Spenden an. Um sich für den aktuellen Stand von RSScrawler zu bedanken können Bitcoin gesendet werden. Features und Support werden hier nicht verkauft.

Danke!

TLDR:

Aktiviere Ordnerüberwachung im JDownloader 2
Installiere Python 2.7 und die Zusatzpakete: docopt, feedparser, BeautifulSoup, pycurl, lxml, requests, cherrypy
Starte RSScrawler einmalig, dies erstellt den Einstellungen-Ordner inklusive aller benötigter Dateien
Passe den jdownloaderpath, sowie port in der RSScrawler.ini an.
Nutze RSScrawler. Alle Einstellungen sind nun unter dem gewählten Port und der IP des Rechners verfügbar!

Optional stehen fertige Builds für docker, Windows und Synology zur Verfügung!

Für macOS bitte beachten:

Die fehlenden Module müssen mit:

python -m pip install [MODULNAME] installiert werden

RSScrawler starten:

python RSScrawler.py führt RSScrawler aus

Startparameter:

--testlauf Einmalige Ausführung von RSScrawler

--port=<PORT> Legt den Port des Webservers fest

--jd-pfad=<JDPFAD> Legt den Pfad von JDownloader fest (nützlich bei headless-Systemen), diese Option darf keine Leerzeichen enthalten

--log-level=<LOGLEVEL> Legt fest, wie genau geloggt wird (CRITICAL, ERROR, WARNING, INFO, DEBUG, NOTSET )

Einstellungen:

Die RSScrawler.ini liegt im Einstellungen Ordner und wird (inklusive der Listen) beim ersten Start automatisch generiert. Danach ist der RSScrawler noch nicht einsatzbereit.

Zunächst muss der JDownloader-Pfad hinterlegt werden, ansonsten beendet sich RSScrawler automatisch mit einem Warnhinweis!

Der JDownloader-Pfad und der Port des Webserver kann daher per Startparameter festgelegt werden. Standardport ist 9090.

Sollte kein unmittelbarer Zugriff auf die RSScrawler.ini möglich sein, lässt sich RSScrawler mit den Parametern --jd-pfad und --port korrekt starten. Hierbei werden die entsprechenden Einträge der RSScrawler.ini ignoriert.

Für Pfade mit Leerzeichen kann nicht der --jd-pfad Parameter verwendet werden. Diese müssen direkt in der RSScrawler.ini hinterlegt werden.

Alle weiteren Einstellungen können nach Belieben über den Webserver angepasst werden und sind dort hinreichend erklärt. Ein direktes Bearbeiten der Einstellungen und Listen ist möglich, aber nicht empfehlenswert.

Releases:

Plattform	Autor	Status
Windows	rix1337	Offiziell
Docker	rix1337	Offiziell
Synology	neutron666	Inoffiziell*

*eventuell nicht auf aktuellem Stand

Name		Name	Last commit message	Last commit date
Latest commit History 24 Commits
.gitignore		.gitignore
ISSUE_TEMPLATE.md		ISSUE_TEMPLATE.md
PULL_REQUEST_TEMPLATE.md		PULL_REQUEST_TEMPLATE.md
README.md		README.md
RSScrawler.py		RSScrawler.py
cherry.py		cherry.py
common.py		common.py
requirements.txt		requirements.txt
rssconfig.py		rssconfig.py
rssdb.py		rssdb.py
timer.py		timer.py

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Repository files navigation

RSScrawler - Version 2.0.9

Credits:

Bedanken:

TLDR:

RSScrawler starten:

Startparameter:

Einstellungen:

Releases:

About

Releases

Packages

Languages

Itsie/RSScrawler

Folders and files

Latest commit

History

Repository files navigation

RSScrawler - Version 2.0.9

Credits:

Bedanken:

TLDR:

RSScrawler starten:

Startparameter:

Einstellungen:

Releases:

About

Resources

Stars

Watchers

Forks

Releases

Packages 0

Languages

Packages