RSScrawler.py

# -*- coding: utf-8 -*-
# RSScrawler - Version 2.0.9
# Projekt von https://github.com/rix1337
# Enthält Code von:
# https://github.com/dmitryint (im Auftrag von https://github.com/rix1337)
# https://github.com/zapp-brannigan/own-pyload-plugins/blob/master/hooks/MovieblogFeed.py
# https://github.com/Gutz-Pilz/pyLoad-stuff/blob/master/SJ.py
# https://github.com/bharnett/Infringer/blob/master/LinkRetrieve.py
# Beschreibung:
# RSScrawler erstellt .crawljobs für den JDownloader.

# Startparameter/Hilfetext für docopt (nicht verändern!)
"""RSScrawler.

Usage:
  RSScrawler.py [--testlauf]
                [--docker]
                [--port=<PORT>]
                [--jd-pfad=<JDPATH>]
                [--log-level=<LOGLEVEL>]

Options:
  --testlauf                Einmalige Ausführung von RSScrawler
  --docker                  Sperre Pfad und Port auf Docker-Standardwerte (um falsche Einstellungen zu vermeiden)
  --port=<PORT>             Legt den Port des Webservers fest
  --jd-pfad=<JDPFAD>        Legt den Pfad von JDownloader vorab fest (nützlich bei headless-Systemen), diese Option darf keine Leerzeichen enthalten
  --log-level=<LOGLEVEL>    Legt fest, wie genau geloggt wird (CRITICAL, ERROR, WARNING, INFO, DEBUG, NOTSET )
"""

# Globale Variablen
version = "v.2.0.9"
placeholder_filme = False
placeholder_staffeln = False
placeholder_serien = False
placeholder_regex = False

# Externe Importe
from docopt import docopt
from lxml import html
import requests
import feedparser
import re
import urllib
import urllib2
import codecs
import base64
from BeautifulSoup import BeautifulSoup
import pycurl
import time
import sys
import signal
import logging
import os
import errno
import socket
from multiprocessing import Process

# Interne Importe
from rssconfig import RssConfig
from rssdb import RssDb
from timer import RepeatableTimer
import common
import cherry

# Importiere SimpleJson oder Json (nach Verfügbarkeit)
try:
    import simplejson as json
except ImportError:
    import json

# Schreibe Crawljob für JDownloader (inkl. Parameter aus MB/SJ Funktionen)
def write_crawljob_file(package_name, folder_name, link_text, crawljob_dir, subdir):
    # Crawljobs enden auf .crawljob
    crawljob_file = crawljob_dir + '/%s.crawljob' % unicode(
        # Windows-inkompatible Sonderzeichen/Leerzeichen werden ersetzt
        re.sub('[^\w\s\.-]', '', package_name.replace(' ', '')).strip().lower()
    )
    # Versuche .crawljob zu schreiben
    try:
        # Öffne Crawljob mit Schreibzugriff
        file = open(crawljob_file, 'w')
        # Optionen für Paketeigenschaften im JDownloader:
        # Paket ist aktiviert
        file.write('enabled=TRUE\n')
        # Download startet automatisch
        file.write('autoStart=TRUE\n')
        # Archive automatisch entpacken
        file.write('extractAfterDownload=TRUE\n')
        # Erzwinge automatischen Start
        file.write('forcedStart=TRUE\n')
        # Bestätige Fragen des JDownloaders automatisch
        file.write('autoConfirm=TRUE\n')
        # Unterverzeichnis des Downloads ist folder_name & subdir wird wenn es nicht leer ist mit angegeben. Subdir hilft bei der Automatisierung (bspw. über Filebot).
        if not subdir == "":
            file.write('downloadFolder=' + subdir + "/" + '%s\n' % folder_name)
            # Niedrige Priorität für erzwungene zweisprachige Downloads
            if subdir == "RSScrawler/Remux":
                file.write('priority=Lower')
        else:
            file.write('downloadFolder=' + '%s\n' % folder_name)
        # Name des Pakets im JDownloader ist package_name (ohne Leerzeichen!)
        file.write('packageName=%s\n' % package_name.replace(' ', ''))
        # Nutze ersten Eintrag (lt. Code einzigen!) des link_text Arrays als Downloadlink
        file.write('text=%s\n' % link_text[0])
        # Beende Schreibvorgang
        file.close()
        # Bestätige erfolgreichen Schreibvorgang
        return True
    # Bei Fehlern:
    except UnicodeEncodeError as e:
        # Beende Schreibvorgang
        file.close()
        # Erläutere den Fehler im Log inkl. Dateipfad des Crawljobs und Fehlerbericht
        logging.error("While writing in the file: %s the error occurred: %s" %(crawljob_file, e.message))
        # Wenn hiernach ein fehlerhafter Crawljob zurück bleibt
        if os.path.isfile(crawljob_file):
            # Logge das weitere Vorgehen
            logging.info("Removing broken file: %s" % crawljob_file)
            # Entferne den Crawljob
            os.remove(crawljob_file)
        # Vermerke fehlgeschlagenen Schreibvorgang
        return False

def checkIp():
    s = socket.socket(socket.AF_INET, socket.SOCK_DGRAM)
    try:
        s.connect(('10.255.255.255', 0))
        IP = s.getsockname()[0]
    except:
        IP = '127.0.0.1'
    finally:
        s.close()
    return IP

# Prüffunktion ob Punkte, Sonderzeichen und falsche Trennzeichen vorhanden sind
def checkFiles():
    with open(os.path.join(os.path.dirname(sys.argv[0]), 'Einstellungen/RSScrawler.ini'), 'r+') as f:
        content = f.read()
        f.seek(0)
        f.truncate()
        f.write(content.replace(';', ','))
    with open(os.path.join(os.path.dirname(sys.argv[0]), 'Einstellungen/Listen/MB_Filme.txt'), 'r+') as f:
        content = f.read()
        f.seek(0)
        f.truncate()
        f.write(content.replace('.', ' ').replace(';', ',').replace('Ä', 'Ae').replace('ä', 'ae').replace('Ö', 'Oe').replace('ö', 'oe').replace('Ü', 'Ue').replace('ü', 'ue').replace('ß', 'ss').replace('(', '').replace(')', '').replace('(', '').replace('*', '').replace('(', '').replace('|', '').replace('\\', '').replace('?', '').replace('!', '').replace('  ', ' '))
    with open(os.path.join(os.path.dirname(sys.argv[0]), 'Einstellungen/Listen/MB_Staffeln.txt'), 'r+') as f:
        content = f.read()
        f.seek(0)
        f.truncate()
        f.write(content.replace('.', ' ').replace(';', ',').replace('Ä', 'Ae').replace('ä', 'ae').replace('Ö', 'Oe').replace('ö', 'oe').replace('Ü', 'Ue').replace('ü', 'ue').replace('ß', 'ss').replace('(', '').replace(')', '').replace('(', '').replace('*', '').replace('(', '').replace('|', '').replace('\\', '').replace('?', '').replace('!', '').replace('  ', ' '))
    with open(os.path.join(os.path.dirname(sys.argv[0]), 'Einstellungen/Listen/SJ_Serien.txt'), 'r+') as f:
        content = f.read()
        f.seek(0)
        f.truncate()
        f.write(content.replace('.', ' ').replace(';', ',').replace('Ä', 'Ae').replace('ä', 'ae').replace('Ö', 'Oe').replace('ö', 'oe').replace('Ü', 'Ue').replace('ü', 'ue').replace('ß', 'ss').replace('(', '').replace(')', '').replace('(', '').replace('*', '').replace('(', '').replace('|', '').replace('\\', '').replace('?', '').replace('!', '').replace('  ', ' '))

# MovieBlog
def notifyPushbulletMB(apikey,text):
    # Wenn kein API-Key vergeben wurde:
    if apikey == "0" or apikey == "":
        # Beende vorzeitig
        return
    # Definiere Typ (note), Titel (RSScrawler), und Textinhalt (den Releasetitel) der Pushbullet-Nachricht
    postData = '{"type":"note", "title":"RSScrawler:", "body":"%s"}' %" ### ".join(text).encode("utf-8")
    # Vorgang erfolgt über pycurl an die pushbuan die pushbullet API
    c = pycurl.Curl()
    c.setopt(pycurl.WRITEFUNCTION, lambda x: None)
    c.setopt(pycurl.URL, 'https://api.pushbullet.com/v2/pushes')
    c.setopt(pycurl.HTTPHEADER, ['Content-Type: application/json'])
    c.setopt(pycurl.USERPWD, apikey.encode('utf-8'))
    c.setopt(pycurl.POST, 1)
    c.setopt(pycurl.POSTFIELDS, postData)
    c.perform()

# Versuche Ordner anzulegen um Ordner zu erstellen (mit Fehlererkennung)
def _mkdir_p(path):
    # Versuche Ordner anzulegen:
    try:
        os.makedirs(path)
    except OSError as e:
        # Kein Fehler, wenn Pfad bereits existiert
        if e.errno == errno.EEXIST and os.path.isdir(path):
            pass
        # Ansonsten logge den Fehler
        else:
            logging.error("Kann Pfad nicht anlegen: %s" % path)
            raise

# Funktion für das wiederholte Ausführen des Scriptes
def _restart_timer(func):
    def wrapper(self):
        func(self)
        # Wenn testlauf inaktiv ist wurde dies aktiviert. Der folgende Code führt das Script in Intervallen aus
        if self._periodical_active:
            self.periodical.cancel()
            self.periodical.start()
    return wrapper
		
class MB():
    FEED_URL = "http://www.movie-blog.org/feed/"
    SUBSTITUTE = "[&#\s/]"
    _INTERNAL_NAME='MB'

    def __init__(self):
        self.config = RssConfig(self._INTERNAL_NAME)
        self.log_info = logging.info
        self.log_error = logging.error
        self.log_debug = logging.debug
        self.db = RssDb(os.path.join(os.path.dirname(sys.argv[0]), "Einstellungen/Downloads/MB_Downloads.db"))
        self.filme = os.path.join(os.path.dirname(sys.argv[0]), 'Einstellungen/Listen/MB_Filme.txt')
        self.staffeln = os.path.join(os.path.dirname(sys.argv[0]), 'Einstellungen/Listen/MB_Staffeln.txt')
        self._hosters_pattern = rsscrawler.get('hoster').replace(',','|')
        self._periodical_active = False
        self.periodical = RepeatableTimer(
            int(rsscrawler.get('interval')) * 60,
            self.periodical_task
        )
        self.dictWithNamesAndLinks = {}

    def activate(self):
        self._periodical_active = True
        self.periodical.start()
        return self

    def readInput(self, file):
        if not os.path.isfile(file):
            open(file, "a").close()
            placeholder = open(file, 'w')
            placeholder.write('Ein Titel Pro Zeile - BEACHTE DIE HINWEISE')
            placeholder.close()
        try:
            f = codecs.open(file, "rb")
            return f.read().splitlines()
        except:
            self.log_error("Liste nicht gefunden!")

    def getPatterns(self, patterns, quality, rg, sf):
        # Importiere globale Parameter (sollten beide Falsch sein)
        global placeholder_filme
        global placeholder_staffeln
        # Wenn Liste exakt die Platzhalterzeile enthält:
        if patterns == ["Ein Titel Pro Zeile - BEACHTE DIE HINWEISE"]:
            # Wenn keine Information zur Quellart weitergegeben wurde (gilt nur bei Staffeln, Standard ist: BluRay):
            if sf == None:
                # Logge vorhandenen Platzhalter, der in der Filme-Liste stehen muss (da keine Quellart angegeben)
                self.log_debug("Liste enthält Platzhalter. Stoppe Suche für MB_Filme!")
                # Setze globale Variable auf wahr, um in der MB-Klasse die Suche abbrechen zu können
                placeholder_filme = True
            else:
                # Logge vorhandenen Platzhalter, der in der Staffeln-Liste stehen muss (da Quellart angegeben)
                self.log_debug("Liste enthält Platzhalter. Stoppe Suche für MB_Staffeln!")
                # Setze globale Variable auf wahr, um in der MB-Klasse die Suche abbrechen zu können
                placeholder_staffeln = True
        # Ansonsten gib die Zeilen einzeln als Zeilen in patters zurück
        return {line: (quality, rg, sf) for line in patterns}

    def searchLinks(self, feed):
        ignore = "|".join(["\.%s(\.|-)" % p for p in self.config.get("ignore").lower().split(',')]) if not self.config.get("ignore") == "" else "^unmatchable$"
        
        for key in self.allInfos:
            s = re.sub(self.SUBSTITUTE,".",key).lower()
            for post in feed.entries:
                """Suche nach Titel"""
                found = re.search(s,post.title.lower())
                if found:
                    """Prüfe ob Release ignoriert werden soll (basierend auf ignore-Einstellung)"""
                    found = re.search(ignore,post.title.lower())
                    if found:
                        # Wenn zu ignorierender Eintrag, logge diesen
                        self.log_debug("%s - Release ignoriert (basierend auf ignore-Einstellung)" %post.title)
                        continue
                    """Suche nach Qualität"""
                    ss = self.allInfos[key][0].lower()

                    # Crawl3d Funktion gilt wenn 3D im Titel enthalten ist
                    if '.3d.' in post.title.lower():
                        # Wenn crawl3d aktiv ist und 1080p/1080i zusätzlich zu 3D im Titel steht:
                        if self.config.get('crawl3d') and ("1080p" in post.title.lower() or "1080i" in post.title.lower()):
                            # Release gilt als gefunden
                            found = True
                        # Ansonsten ignoriere das Release mit 3D im Titel (weil es bspw. in 720p released wurde)
                        else:
                            continue
                    # Funktion, die Listeneinträge wie folgt erwartet: Titel,Auflösung,Gruppe
                    else:
                        if ss == "480p":
                            if "720p" in post.title.lower() or "1080p" in post.title.lower() or "1080i" in post.title.lower():
                                continue
                            found = True
                        else:
                            found = re.search(ss,post.title.lower())
                    if found:
                        # Funktion, die Listeneinträge wie folgt erwartet: Titel,Auflösung,Gruppe
                        """Suche nach Release-Gruppe"""
                        sss = "[\.-]+"+self.allInfos[key][1].lower()
                        found = re.search(sss,post.title.lower())

                        if self.allInfos[key][2]:
                            # Wenn alles True, dann found = True (also gilt Release nur als gefunden, wenn alle Parameter wahr sind)
                            found = all([word in post.title.lower() for word in self.allInfos[key][2]])

                        if found:
                            # Check, ob das Release zu einer Serie gehört
                            try:
                                episode = re.search(r'([\w\.\s]*s\d{1,2}e\d{1,2})[\w\.\s]*',post.title.lower()).group(1)
                                if "repack" in post.title.lower():
                                    episode = episode + "-repack"
                                self.log_debug("Serie entdeckt. Kürze Titel: [%s]" %episode)
                                yield (episode, [post.link], key)
                            except:
                                # Gebe den Link (der alle obigen Checks bestandend hat) weiter
                                yield (post.title, [post.link], key)


    def download_dl(self, title):
        # Schreibe den nicht-zweisprachigen Titel für die folgende Suche um
        text = []
        # Dies generiert den in die Suche einfügbaren String (+ statt Leerzeichen)
        search_title = title.replace(".German.720p.", ".German.DL.1080p.").replace(".German.DTS.720p.", ".German.DTS.DL.1080p.").replace(".German.AC3.720p.", ".German.AC3.DL.1080p.").replace(".German.AC3LD.720p.", ".German.AC3LD.DL.1080p.").replace(".German.AC3.Dubbed.720p.", ".German.AC3.Dubbed.DL.1080p.").split('.x264-', 1)[0].split('.h264-', 1)[0].replace(".", " ").replace(" ", "+")
        search_url = "http://www.movie-blog.org/search/" + search_title + "/feed/rss2/"
        # Nach diesem String (also Releasetitel) wird schlussendlich in den Suchergebnissen gesucht (. statt Leerzeichen)
        feedsearch_title = title.replace(".German.720p.", ".German.DL.1080p.").replace(".German.DTS.720p.", ".German.DTS.DL.1080p.").replace(".German.AC3.720p.", ".German.AC3.DL.1080p.").replace(".German.AC3LD.720p.", ".German.AC3LD.DL.1080p.").replace(".German.AC3.Dubbed.720p.", ".German.AC3.Dubbed.DL.1080p.").split('.x264-', 1)[0].split('.h264-', 1)[0]
        if not '.dl.' in feedsearch_title.lower():
            self.log_debug("%s - Release ignoriert (nicht zweisprachig, da wahrscheinlich nicht Retail)" %feedsearch_title)
            return
        
        # Suche nach title im Ergebnisfeed der obigen Suche (nicht nach dem für die suche genutzten search_title)
        for (key, value, pattern) in self.dl_search(feedparser.parse(search_url), feedsearch_title, title):
            # Wenn das Release als bereits hinzugefügt in der Datenbank vermerkt wurde, logge dies und breche ab
            if self.db.retrieve(key) == 'added' or self.db.retrieve(key) == 'dl':
                self.log_debug("%s - zweisprachiges Release ignoriert (bereits gefunden)" % key)
            # Ansonsten speichere das Release als hinzugefügt in der Datenbank
            else:
                self.db.store(
                    key,
                    # Vermerke zweisprachiges Release entsprechend in der Datenbank
                    'dl' if self.config.get('enforcedl') and '.dl.' in key.lower() else 'added',
                    pattern
                    )
                
                # Logge gefundenes Release auch im RSScrawler (Konsole/Logdatei)
                self.log_info(key + " [Zweisprachig]")
                # Nimm nur den ersten validen Downloadlink der auf der Unterseite eines jeden Releases gefunden wurde
                download_link = [common.get_first(self._get_download_links(value[0], self._hosters_pattern))]
                # Füge Release nur hinzu, wenn überhaupt ein Link gefunden wurde (erzeuge hierfür einen crawljob)
                if any(download_link):
                    write_crawljob_file(
                        key,
                        key,
                        download_link,
                        jdownloaderpath + "/folderwatch",
                        "RSScrawler/Remux"
                    ) and text.append(key)
            # Wenn zuvor ein key dem Text hinzugefügt wurde (also ein Release gefunden wurde):
            if len(text) > 0:
                # Löse Pushbullet-Benachrichtigung aus
                notifyPushbulletMB(rsscrawler.get("pushbulletapi"),text)
                return True
                
    def dl_search(self, feed, title, notdl_title):
        ignore = "|".join(["\.%s(\.|-)" % p for p in self.config.get("ignore").lower().split(',')]) if not self.config.get("ignore") == "" else "^unmatchable$"
            
        s = re.sub(self.SUBSTITUTE,".",title).lower()
        for post in feed.entries:
            """Suche nach Titel"""
            found = re.search(s,post.title.lower())
            if found:
                """Prüfe ob Release ignoriert werden soll (basierend auf ignore-Einstellung)"""
                found = re.search(ignore,post.title.lower())
                if found:
                    # Wenn zu ignorierender Eintrag, logge diesen
                    self.log_debug("%s - zweisprachiges Release ignoriert (basierend auf ignore-Einstellung)" %post.title)
                    continue
                yield (post.title, [post.link], title)
                                

    # Suchfunktion für Downloadlinks (auf der zuvor gefundenen Unterseite):
    def _get_download_links(self, url, hosters_pattern=None):
        # Definiere die zu durchsuchende Baumstruktur (auf Basis der Unterseite)
        tree = html.fromstring(requests.get(url).content)
        # Genaue Anweisung, wo die Links zu finden sind (Unterhalb des Download:/Mirror # Textes)
        xpath = '//*[@id="content"]/span/div/div[2]//strong[contains(text(),"Download:") or contains(text(),"Mirror #")]/following-sibling::a[1]'
        # Jeder link wird zurück gegeben, wenn kein Wunschhoster festgelegt wurde. Ansonsten werden nur Links zum Wunschhoster weitergegeben.
        return [common.get_first(link.xpath('./@href')) for link in tree.xpath(xpath) if hosters_pattern is None or re.search(hosters_pattern, link.text, flags=re.IGNORECASE)]

    # Periodische Aufgabe
    @_restart_timer
    def periodical_task(self):
        # Leere/Definiere interne URL/Text-Arrays
        urls = []
        text = []
            
        # Definiere interne Suchliste auf Basis der MB_Serien, MB_Staffeln (und notdl) Listen
        self.allInfos = dict(
            # Füge der Suche sämtliche Titel aus der MB_Filme Liste hinzu
            set({key: value for (key, value) in self.getPatterns(
                    self.readInput(self.filme),
                    self.config.get('quality'),
                    '.*',
                    None
                ).items()}.items()
            ) |
            # Füge weiterhin alle Titel aus der MB_Staffeln Liste (inklusive der Qulitäts-/Quell-Einstellungen) hinzu
            set(self.getPatterns(
                    self.readInput(self.staffeln),
                    self.config.get('seasonsquality'),
                    '.*',
                    ('.complete.','.' + self.config.get('seasonssource') + '.')
            ).items() if self.config.get('crawlseasons') else [])
        )
        
        # Stoppe Suche wenn Platzhalter aktiv
        if placeholder_filme and placeholder_staffeln:
            return

        # Wenn historical aktiv ist nutzt RSScrawler die Suchfunktion von MB, statt nur den (zeitlich begrenzten) Feed zu nutzen. Dies dauert etwas länger, durchsucht aber den kompletten MB!
        if self.config.get("historical"):
            # Suche nach jeder Zeile in der internen Suchliste
            for xline in self.allInfos.keys():
                # Wenn die Zeile nicht leer ist bzw. keine Raute (für Kommentare) enthält:
                if len(xline) > 0 and not xline.startswith("#"):
                    # Entferne Zusatzinfos der obsoleten Funktion, die Listeneinträge wie folgt erwartet: Titel,Auflösung,Gruppe
                    # Die Suche Benötigt nur den Titel vor dem ersten Komma. Ersetze Weiterhin Punkte durch Leerzeichen und diese für die Suche durch ein +
                    xn = xline.split(",")[0].replace(".", " ").replace(" ", "+")
                    # Generiere aus diesen Suchurl-kompatiblen String als Seitenaufruf (entspricht einer Suche auf MB nach dem entsprechenden Titel) eine Liste an Suchanfragen-URLs (Anzahl entspricht Einträgen der internen Suchliste)
                    urls.append('http://www.movie-blog.org/search/%s/feed/rss2/' %xn)
        # Nutze ansonsten den Feed (und dessen Inhalt) als Grundlage zur Suche
        else:
            # Hierfür wird nur eine einzelne URL (die oben vergebene) benötigt
            urls.append(self.FEED_URL)

        # Suchfunktion für valide Releases (und deren Downloadlinks) wird für jede URL durchgeführt:
        for url in urls:
            # Führe für jeden Eintrag auf der URL eine Suche nach Releases durch:
            for (key, value, pattern) in self.searchLinks(feedparser.parse(url)):
                # Suche nach zweisprachigem Release, sollte das aktuelle nicht zweisprachig sein:
                if self.config.get('enforcedl') and '.dl.' not in key.lower():
                    # Wenn die Suche für zweisprachige Releases nichts findet (wird zugleich ausgeführt)
                    if not self.download_dl(key):
                        # Logge nicht gefundenes zweisprachiges Release
                        self.log_debug("%s - Kein zweisprachiges Release gefunden" %key)
                            
                # Wenn das Release als bereits hinzugefügt in der Datenbank vermerkt wurde, logge dies und breche ab
                if self.db.retrieve(key) == 'added' or self.db.retrieve(key) == 'notdl':
                    self.log_debug("%s - Release ignoriert (bereits gefunden)" % key)
                # Ansonsten speichere das Release als hinzugefügt in der Datenbank
                else:
                    self.db.store(
                        key,
                        # Vermerke Releases, die nicht zweisprachig sind in der Datenbank (falls enforcedl aktiv ist). Speichere jedes gefundene Release
                        'notdl' if self.config.get('enforcedl') and '.dl.' not in key.lower() else 'added',
                        pattern
                    )
                    
                    # Logge gefundenes Release auch im RSScrawler (Konsole/Logdatei)
                    self.log_info(key)
					# Nimm nur den ersten validen Downloadlink der auf der Unterseite eines jeden Releases gefunden wurde
                    download_link = [common.get_first(self._get_download_links(value[0], self._hosters_pattern))]
                    # Füge Release nur hinzu, wenn überhaupt ein Link gefunden wurde (erzeuge hierfür einen crawljob)
                    if any(download_link):
                        write_crawljob_file(
                            key,
                            key,
                            download_link,
                            jdownloaderpath + "/folderwatch",
                            "RSScrawler"
                        ) and text.append(key)
        # Wenn zuvor ein key dem Text hinzugefügt wurde (also ein Release gefunden wurde):
        if len(text) > 0:
            # Löse Pushbullet-Benachrichtigung aus
            notifyPushbulletMB(rsscrawler.get("pushbulletapi"),text)

# Serienjunkies
def getSeriesList(file):
    global placeholder_serien
    if not os.path.isfile(file):
        open(file, "a").close()
        placeholder = open(file, 'w')
        placeholder.write('Ein Titel Pro Zeile - BEACHTE DIE HINWEISE')
        placeholder.close()
    try:
        titles = []
        f = codecs.open(file, "rb", "utf-8")
        for title in f.read().splitlines():
            if len(title) == 0:
                continue
            title = title.replace(" ", ".")
            titles.append(title)
        f.close()
        if titles[0] == "RSSCRAWLER.VON.RIX.-.Ein.Titel.Pro.Zeile.-.BEACHTE.DIE.README.md":
            logging.debug("Liste enthält Platzhalter. Stoppe Suche für SJ_Serien!")
            placeholder_serien = True
        return titles
    except UnicodeError:
        logging.error("ANGEHALTEN, ungültiges Zeichen in SJ_Serien Liste!")
    except IOError:
        logging.error("ANGEHALTEN, SJ_Serien nicht gefunden!")
    except Exception, e:
        logging.error("Unbekannter Fehler: %s" %e)

def getRegexSeriesList(file):
    global placeholder_regex
    if not os.path.isfile(file):
        open(file, "a").close()
        placeholder = open(file, 'w')
        placeholder.write('Ein Titel Pro Zeile - BEACHTE DAS REGEX FORMAT UND DIE HINWEISE')
        placeholder.close()
    try:
        titles = []
        f = codecs.open(file, "rb", "utf-8")
        for title in f.read().splitlines():
            if len(title) == 0:
                continue
            title = title.replace(" ", ".")
            titles.append(title)
        f.close()
        if titles[0] == "RSSCRAWLER.VON.RIX.-.Ein.Titel.Pro.Zeile.-.BEACHTE.DAS.REGEX.FORMAT.UND.DIE.README.md":
            logging.debug("Liste enthält Platzhalter. Stoppe Suche für SJ_Serien_Regex!")
            placeholder_regex = True
        return titles
    except UnicodeError:
        logging.error("ANGEHALTEN, ungültiges Zeichen in SJ_Serien_Regex Liste!")
    except IOError:
        logging.error("ANGEHALTEN, SJ_Serien_Regex nicht gefunden!")
    except Exception, e:
        logging.error("Unbekannter Fehler: %s" %e)

def notifyPushbulletSJ(api='', msg=''):
    data = urllib.urlencode({
        'type': 'note',
        'title': 'RSScrawler:',
        'body': "\n\n".join(msg)
    })
    auth = base64.encodestring('%s:' %api).replace('\n', '')
    try:
        req = urllib2.Request('https://api.pushbullet.com/v2/pushes', data)
        req.add_header('Authorization', 'Basic %s' % auth)
        response = urllib2.urlopen(req)
    except urllib2.HTTPError:
        logging.debug('FEHLER - Konnte Pushbullet API nicht erreichen')
        return False
    res = json.load(response)
    if res['sender_name']:
        logging.debug('Pushbullet Erfolgreich versendet')
    else:
        logging.debug('FEHLER - Konnte nicht an Pushbullet Senden')


def getURL(url):
    try:
        req = urllib2.Request(
            url,
            None,
            {'User-agent' : 'Mozilla/5.0 (Windows NT 10.0; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/53.0.2785.116 Safari/537.36'}
        )
        return urllib2.urlopen(req).read()
    except urllib2.HTTPError as e:
        logging.debug('Bei der HTTP-Anfrage ist ein Fehler Aufgetreten: Fehler: %s Grund: %s' % (e.code, e.reason))
        return ''
    except urllib2.URLError as e:
        logging.debug('Bei der HTTP-Anfrage ist ein Fehler Aufgetreten: Grund: %s' %  e.reason)
        return ''
    except socket.error as e:
        logging.debug('Die HTTP-Anfrage wurde unterbrochen. Grund: %s' %  e)
        return ''

class SJ():
    MIN_CHECK_INTERVAL = 2 * 60 # Minimales Intervall: 2 Minuten
    _INTERNAL_NAME = 'SJ'

    def __init__(self):
        self.config = RssConfig(self._INTERNAL_NAME)
        self.log_info = logging.info
        self.log_error = logging.error
        self.log_debug = logging.debug
        self.db = RssDb(os.path.join(os.path.dirname(sys.argv[0]), "Einstellungen/Downloads/SJ_Downloads.db"))
        self.serien = os.path.join(os.path.dirname(sys.argv[0]), 'Einstellungen/Listen/SJ_Serien.txt')
        self._periodical_active = False
        self.periodical = RepeatableTimer(
            int(rsscrawler.get('interval')) * 60,
            self.periodical_task
        )

    def activate(self):
        self._periodical_active = True
        self.periodical.start()

    @_restart_timer
    def periodical_task(self):
        feed = feedparser.parse('http://serienjunkies.org/xml/feeds/episoden.xml')
        self.pattern = "|".join(getSeriesList(os.path.join(os.path.dirname(sys.argv[0]), "Einstellungen/Listen/SJ_Serien.txt"))).lower()
        # Stoppe Suche wenn Platzhalter aktiv
        if placeholder_serien:
            return
        reject = self.config.get("rejectlist").replace(",","|").lower() if len(self.config.get("rejectlist")) > 0 else "^unmatchable$"
        self.quality = self.config.get("quality")
        self.hoster = rsscrawler.get("hoster")
        # Ersetze die Hosterbezeichnung für weitere Verwendung im Script
        if self.hoster == "Uploaded":
            # Auf SJ wird Uploaded als Teil der url geführt: ul
            self.hoster = "ul"
        elif self.hoster == "Share-Online":
            # Auf SJ wird Uploaded als Teil der url geführt: so
            self.hoster = "so"
        else:
            self.hoster = "."
        # Lege Array als Typ für die added_items fest (Liste bereits hinzugefügter Releases)
        self.added_items = []

        for post in feed.entries:
            # Seltenen Fehler, bei dem ein Feedeintrag (noch) keinen Link enthält, umgehen:
            if post.link == None:
              continue
          
            link = post.link
            title = post.title

            if self.config.get("quality") != '480p':
                m = re.search(self.pattern,title.lower())
                if m:
                    if '[DEUTSCH]' in title:
                        mm = re.search(self.quality,title.lower())
                        if mm:
                            mmm = re.search(reject,title.lower())
                            if mmm:
                                self.log_debug(title +" - Release ignoriert (basierend auf rejectlist-Einstellung)")
                                continue
                            title = re.sub('\[.*\] ', '', post.title)
                            self.range_checkr(link,title)

                else:
                    m = re.search(self.pattern,title.lower())
                    if m:
                        if '[DEUTSCH]' in title:
                            if "720p" in title.lower() or "1080p" in title.lower():
                                continue
                            mm = re.search(reject,title.lower())
                            if mm:
                                self.log_debug(title +" Release ignoriert (basierend auf rejectlist-Einstellung)")
                                continue
                            title = re.sub('\[.*\] ', '', post.title)
                            self.range_checkr(link,title)

        if len(rsscrawler.get('pushbulletapi')) > 2:
            notifyPushbulletSJ(rsscrawler.get("pushbulletapi"),self.added_items) if len(self.added_items) > 0 else True

    def range_checkr(self, link, title):
        pattern = re.match(".*S\d{2}E\d{2}-\w?\d{2}.*", title)
        if pattern is not None:
            range0 = re.sub(r".*S\d{2}E(\d{2}-\w?\d{2}).*",r"\1", title).replace("E","")
            number1 = re.sub(r"(\d{2})-\d{2}",r"\1", range0)
            number2 = re.sub(r"\d{2}-(\d{2})",r"\1", range0)
            title_cut = re.findall(r"(.*S\d{2}E)(\d{2}-\w?\d{2})(.*)",title)
            try:
                for count in range(int(number1),(int(number2)+1)):
                    NR = re.match("\d{2}", str(count))
                    if NR is not None:
                        title1 = title_cut[0][0] + str(count) + ".*" + title_cut[0][-1]
                        self.range_parse(link, title1)
                    else:
                        title1 = title_cut[0][0] + "0" + str(count) + ".*" + title_cut[0][-1]
                        self.range_parse(link, title1)
            except ValueError as e:
                logging.error("Fehler in Variablenwert: %s" %e.message)
        else:
            self.parse_download(link, title)

    def range_parse(self,series_url, search_title):
        req_page = getURL(series_url)
        soup = BeautifulSoup(req_page)

        try:
            titles = soup.findAll(text=re.compile(search_title))
            for title in titles:
               if self.quality !='480p' and self.quality in title:
                   self.parse_download(series_url, title)
               if self.quality =='480p' and not (('.720p.' in title) or ('.1080p.' in title)):
                   self.parse_download(series_url, title)
        except re.error as e:
            self.log_error('Konstantenfehler: %s' % e)


    def parse_download(self,series_url, search_title):
        req_page = getURL(series_url)
        soup = BeautifulSoup(req_page)
        
        # Da das beautifulsoup per Regex sucht, darf der Suchstring keine Klammern enthalten. Ersetze diese entsprechend durch Wildcard
        escape_brackets = search_title.replace("(", ".*").replace(")", ".*")

        title = soup.find(text=re.compile(escape_brackets))
        if title:
            items = []
            links = title.parent.parent.findAll('a')
            for link in links:
                url = link['href']
                pattern = '.*%s_.*' % self.hoster
                if re.match(pattern, url):
                    items.append(url)
            self.send_package(title,items) if len(items) > 0 else True

    def send_package(self, title, link):
        try:
            storage = self.db.retrieve(title)
        except Exception as e:
            self.log_debug("Fehler bei Datenbankzugriff: %s, Grund: %s" % (e,title))
        if storage == 'downloaded':
            self.log_debug(title + " - Release ignoriert (bereits gefunden)")
        else:
            self.log_info(title)
            self.db.store(title, 'downloaded')
            write_crawljob_file(title, title, link,
                                jdownloaderpath + "/folderwatch", "RSScrawler") and self.added_items.append(title.encode("utf-8"))

class SJregex():
    MIN_CHECK_INTERVAL = 2 * 60 # Minimales Intervall: 2 Minuten
    _INTERNAL_NAME = 'SJ'

    def __init__(self):
        self.config = RssConfig(self._INTERNAL_NAME)
        self.log_info = logging.info
        self.log_error = logging.error
        self.log_debug = logging.debug
        if self.config.get("regex"):
            self.db = RssDb(os.path.join(os.path.dirname(sys.argv[0]), "Einstellungen/Downloads/SJ_Downloads.db"))
            self._periodical_active = False
            self.periodical = RepeatableTimer(
                int(rsscrawler.get('interval')) * 60,
                self.periodical_task
            )

    def activate(self):
        self._periodical_active = True
        self.periodical.start()

    @_restart_timer
    def periodical_task(self):
        feed = feedparser.parse('http://serienjunkies.org/xml/feeds/episoden.xml')
        self.pattern = "|".join(getRegexSeriesList(os.path.join(os.path.dirname(sys.argv[0]), "Einstellungen/Listen/SJ_Serien_Regex.txt"))).lower()
        # Stoppe Suche wenn Platzhalter aktiv
        if placeholder_regex:
            return
        reject = self.config.get("rejectlist").replace(",","|").lower() if len(self.config.get("rejectlist")) > 0 else "^unmatchable$"
        self.quality = self.config.get("quality")
        self.hoster = rsscrawler.get("hoster")
        # Ersetze die Hosterbezeichnung für weitere Verwendung im Script
        if self.hoster == "Uploaded":
            # Auf SJ wird Uploaded als Teil der url geführt: ul
            self.hoster = "ul"
        elif self.hoster == "Share-Online":
            # Auf SJ wird Uploaded als Teil der url geführt: so
            self.hoster = "so"
        else:
            self.hoster = "."
        # Lege Array als Typ für die added_items fest (Liste bereits hinzugefügter Releases)
        self.added_items = []

        for post in feed.entries:
            link = post.link
            title = post.title

            if self.config.get("regex"):
                m = re.search(self.pattern,title.lower())
                if not m and not "720p" in title and not "1080p" in title:
                    m = re.search(self.pattern.replace("480p","."),title.lower())
                    self.quality = "480p"
                if m:
                    if "720p" in title.lower(): self.quality = "720p"
                    if "1080p" in title.lower(): self.quality = "1080p"
                    m = re.search(reject,title.lower())
                    if m:
                        self.log_debug(title + " - Release durch Regex gefunden (trotz rejectlist-Einstellung)")
                    title = re.sub('\[.*\] ', '', post.title)
                    self.range_checkr(link,title)

            else:
                continue
            
        if len(rsscrawler.get('pushbulletapi')) > 2:
            notifyPushbulletSJ(rsscrawler.get("pushbulletapi"),self.added_items) if len(self.added_items) > 0 else True

    def range_checkr(self, link, title):
        pattern = re.match(".*S\d{2}E\d{2}-\w?\d{2}.*", title)
        if pattern is not None:
            range0 = re.sub(r".*S\d{2}E(\d{2}-\w?\d{2}).*",r"\1", title).replace("E","")
            number1 = re.sub(r"(\d{2})-\d{2}",r"\1", range0)
            number2 = re.sub(r"\d{2}-(\d{2})",r"\1", range0)
            title_cut = re.findall(r"(.*S\d{2}E)(\d{2}-\w?\d{2})(.*)",title)
            try:
                for count in range(int(number1),(int(number2)+1)):
                    NR = re.match("\d{2}", str(count))
                    if NR is not None:
                        title1 = title_cut[0][0] + str(count) + ".*" + title_cut[0][-1]
                        self.range_parse(link, title1)
                    else:
                        title1 = title_cut[0][0] + "0" + str(count) + ".*" + title_cut[0][-1]
                        self.range_parse(link, title1)
            except ValueError as e:
                logging.error("Fehler in Variablenwert: %s" %e.message)
        else:
            self.parse_download(link, title)

    def range_parse(self,series_url, search_title):
        req_page = getURL(series_url)
        soup = BeautifulSoup(req_page)

        try:
            titles = soup.findAll(text=re.compile(search_title))
            for title in titles:
               if self.quality !='480p' and self.quality in title:
                   self.parse_download(series_url, title)
               if self.quality =='480p' and not (('.720p.' in title) or ('.1080p.' in title)):
                   self.parse_download(series_url, title)
        except re.error as e:
            self.log_error('sre_constants.error: %s' % e)


    def parse_download(self,series_url, search_title):
        req_page = getURL(series_url)
        soup = BeautifulSoup(req_page)
        
        # Da das beautifulsoup per Regex sucht, darf der Suchstring keine Klammern enthalten. Ersetze diese entsprechend durch Wildcard
        escape_brackets = search_title.replace("(", ".*").replace(")", ".*")
        
        title = soup.find(text=re.compile(escape_brackets))
        if title:
            items = []
            links = title.parent.parent.findAll('a')
            for link in links:
                url = link['href']
                pattern = '.*%s_.*' % self.hoster
                if re.match(pattern, url):
                    items.append(url)
            self.send_package(title,items) if len(items) > 0 else True

    def send_package(self, title, link):
        try:
            storage = self.db.retrieve(title)
        except Exception as e:
            self.log_debug("Fehler bei Datenbankzugriff: %s, Grund: %s" % (e,title))
        if storage == 'downloaded':
            self.log_debug(title + " - Release ignoriert (bereits gefunden)")
        else:
            self.log_info(title)
            self.db.store(title, 'downloaded')
            write_crawljob_file(title, title, link,
                                jdownloaderpath + "/folderwatch", "RSScrawler") and self.added_items.append(title.encode("utf-8"))

## Hauptsektion
if __name__ == "__main__":
    arguments = docopt(__doc__, version='RSScrawler')

    # Deaktiviere requests Log
    logging.getLogger("requests").setLevel(logging.WARNING)
    logging.getLogger("urllib3").setLevel(logging.WARNING)

    # Lege loglevel über Startparameter fest
    logging.basicConfig(
        filename=os.path.join(os.path.dirname(sys.argv[0]), 'RSScrawler.log'), format=time.strftime("%Y-%m-%d %H:%M:%S") + ' - %(message)s', level=logging.__dict__[arguments['--log-level']] if arguments['--log-level'] in logging.__dict__ else logging.INFO
    )
    console = logging.StreamHandler()
    console.setLevel(logging.__dict__[arguments['--log-level']] if arguments['--log-level'] in logging.__dict__ else logging.INFO)
    formatter = logging.Formatter(time.strftime("%Y-%m-%d %H:%M:%S") + ' - %(message)s')
    console.setFormatter(formatter)
    logging.getLogger('').addHandler(console)

    #  Zeige Programminformationen in der Konsole
    print("┌─────────────────────────────────────────────────────────┐")
    print("│ Programminfo:    RSScrawler " + version + " von RiX             │")
    print("│ Projektseite:    https://github.com/rix1337/RSScrawler  │")
    print("└─────────────────────────────────────────────────────────┘")
    
    # Erstelle fehlenden Einstellungen Ordner
    if not os.path.exists(os.path.join(os.path.dirname(sys.argv[0]), 'Einstellungen')):
        _mkdir_p(os.path.join(os.path.dirname(sys.argv[0]), 'Einstellungen'))
    # Erstelle fehlenden Downloads Ordner
    if not os.path.exists(os.path.join(os.path.dirname(sys.argv[0]), 'Einstellungen/Downloads')):
        _mkdir_p(os.path.join(os.path.dirname(sys.argv[0]), 'Einstellungen/Downloads'))
    # Erstelle fehlenden Listen Ordner
    if not os.path.exists(os.path.join(os.path.dirname(sys.argv[0]), 'Einstellungen/Listen')):
        _mkdir_p(os.path.join(os.path.dirname(sys.argv[0]), 'Einstellungen/Listen'))
    # Erstelle fehlenden Listen mit Platzhaltertexten (diese werden in separaten Funktionen abgefragt!)
    if not os.path.isfile(os.path.join(os.path.dirname(sys.argv[0]), 'Einstellungen/Listen/MB_Filme.txt')):
        open(os.path.join(os.path.dirname(sys.argv[0]), 'Einstellungen/Listen/MB_Filme.txt'), "a").close()
        placeholder = open(os.path.join(os.path.dirname(sys.argv[0]), 'Einstellungen/Listen/MB_Filme.txt'), 'w')
        placeholder.write('Ein Titel Pro Zeile - BEACHTE DIE HINWEISE')
        placeholder.close()
    if not os.path.isfile(os.path.join(os.path.dirname(sys.argv[0]), 'Einstellungen/Listen/MB_Staffeln.txt')):
        open(os.path.join(os.path.dirname(sys.argv[0]), 'Einstellungen/Listen/MB_Staffeln.txt'), "a").close()
        placeholder = open(os.path.join(os.path.dirname(sys.argv[0]), 'Einstellungen/Listen/MB_Staffeln.txt'), 'w')
        placeholder.write('Ein Titel Pro Zeile - BEACHTE DIE HINWEISE')
        placeholder.close()
    if not os.path.isfile(os.path.join(os.path.dirname(sys.argv[0]), 'Einstellungen/Listen/SJ_Serien.txt')):
        open(os.path.join(os.path.dirname(sys.argv[0]), 'Einstellungen/Listen/SJ_Serien.txt'), "a").close()
        placeholder = open(os.path.join(os.path.dirname(sys.argv[0]), 'Einstellungen/Listen/SJ_Serien.txt'), 'w')
        placeholder.write('Ein Titel Pro Zeile - BEACHTE DIE HINWEISE')
        placeholder.close()
    if not os.path.isfile(os.path.join(os.path.dirname(sys.argv[0]), 'Einstellungen/Listen/SJ_Serien_Regex.txt')):
        open(os.path.join(os.path.dirname(sys.argv[0]), 'Einstellungen/Listen/SJ_Serien_Regex.txt'), "a").close()
        placeholder = open(os.path.join(os.path.dirname(sys.argv[0]), 'Einstellungen/Listen/SJ_Serien_Regex.txt'), 'w')
    # Platzhalterzeile weicht bei Regex Liste ab
        placeholder.write('Ein Titel Pro Zeile - BEACHTE DAS REGEX FORMAT UND DIE HINWEISE')
        placeholder.close()
    # Cherrypy Konfig um Fehler wegen fehlender Konfig zu unterdrücken
    if not os.path.exists(os.path.join(os.path.dirname(sys.argv[0]), 'Einstellungen/Web')):
        _mkdir_p(os.path.join(os.path.dirname(sys.argv[0]), 'Einstellungen/Web'))
    if not os.path.isfile(os.path.join(os.path.dirname(sys.argv[0]), 'Einstellungen/Web/cherry.conf')):
        open(os.path.join(os.path.dirname(sys.argv[0]), 'Einstellungen/Web/cherry.conf'), "a").close()
        cherryconf = open(os.path.join(os.path.dirname(sys.argv[0]), 'Einstellungen/Web/cherry.conf'), 'w')
    # Platzhalterzeile weicht bei Regex Liste ab
        cherryconf.write("[global]\nserver.socket_host: '0.0.0.0'\nlog.screen: False\n\nlog.access_file: ''\nlog.error_file: ''\n\n[/]\ntools.gzip.on: True")
        cherryconf.close()
            
    # Setze relativen Dateinamen der Einstellungsdatei    
    einstellungen = os.path.join(os.path.dirname(sys.argv[0]), 'Einstellungen/RSScrawler.ini')
    # Erstelle RSScrawler.ini, wenn nicht bereits vorhanden
    # Wenn jd-pfad Startparameter nicht existiert, erstelle ini ohne diesen Parameter
    if not arguments['--jd-pfad']:
        if not os.path.exists(einstellungen):
            open(einstellungen, "a").close()
            einsteller = open(einstellungen, 'w')
            if arguments['--port']:
                einsteller.write('# RSScrawler.ini (Stand: RSScrawler ' + version + ')\n\n[RSScrawler]\njdownloader = Muss unbedingt vergeben werden!\nport = ' + arguments['--port'] + '\nprefix = \ninterval = 10\nhoster = Uploaded\npushbulletapi = \n\n[MB]\nquality = 720p\nignore = cam,subbed,xvid,dvdr,untouched,remux,pal,md,ac3md,mic,xxx,hou,h-ou\nhistorical = True\ncrawl3d = False\nenforcedl = False\ncrawlseasons = True\nseasonsquality = 720p\nseasonssource = bluray\n\n[SJ]\nquality = 720p\nrejectlist = XviD,Subbed,HDTV\nregex = False')
                einsteller.close()
            else:
                einsteller.write('# RSScrawler.ini (Stand: RSScrawler ' + version + ')\n\n[RSScrawler]\njdownloader = Muss unbedingt vergeben werden!\nport = 9090\nprefix = \ninterval = 10\nhoster = Uploaded\npushbulletapi = \n\n[MB]\nquality = 720p\nignore = cam,subbed,xvid,dvdr,untouched,remux,pal,md,ac3md,mic,xxx,hou,h-ou\nhistorical = True\ncrawl3d = False\nenforcedl = False\ncrawlseasons = True\nseasonsquality = 720p\nseasonssource = bluray\n\n[SJ]\nquality = 720p\nrejectlist = XviD,Subbed,HDTV\nregex = False')
                einsteller.close()
            print('Der Ordner "Einstellungen" wurde erstellt.')
            print('Der Pfad des JDownloaders muss jetzt unbedingt in der RSScrawler.ini hinterlegt werden.')
            print('Weiterhin sollten die Listen entsprechend der README.md gefüllt werden!')
            # Warte 10 Sekunden, damit Windows-Nutzer die Warnung lesen können
            time.sleep(10)
            print('Viel Spass! Beende RSScrawler!')
            sys.exit(0)
    # Ansonsten erstelle ini mit angegebenem Pfad
    else:
        if not os.path.exists(einstellungen):
            open(einstellungen, "a").close()
            einsteller = open(einstellungen, 'w')
            # Prüfe weiterhin ob Port angegeben wurde
            if arguments['--port']:
                einsteller.write('# RSScrawler.ini (Stand: RSScrawler ' + version + ')\n\n[RSScrawler]\njdownloader = ' + arguments['--jd-pfad'] + '\nport = ' + arguments['--port'] + '\nprefix = \ninterval = 10\nhoster = Uploaded\npushbulletapi = \n\n[MB]\nquality = 720p\nignore = cam,subbed,xvid,dvdr,untouched,remux,pal,md,ac3md,mic,xxx,hou,h-ou\nhistorical = True\ncrawl3d = False\nenforcedl = False\ncrawlseasons = True\nseasonsquality = 720p\nseasonssource = bluray\n\n[SJ]\nquality = 720p\nrejectlist = XviD,Subbed,HDTV\nregex = False')
                einsteller.close()
            # Wenn nicht, vergebe nur Pfadangabe
            else:
                einsteller.write('# RSScrawler.ini (Stand: RSScrawler ' + version + ')\n\n[RSScrawler]\njdownloader = ' + arguments['--jd-pfad'] + '\nport = 9090\nprefix = \ninterval = 10\nhoster = Uploaded\npushbulletapi = \n\n[MB]\nquality = 720p\nignore = cam,subbed,xvid,dvdr,untouched,remux,pal,md,ac3md,mic,xxx,hou,h-ou\nhistorical = True\ncrawl3d = False\nenforcedl = False\ncrawlseasons = True\nseasonsquality = 720p\nseasonssource = bluray\n\n[SJ]\nquality = 720p\nrejectlist = XviD,Subbed,HDTV\nregex = False')
                einsteller.close()
            print('Der Ordner "Einstellungen" wurde erstellt.')
            print('Der Pfad des JDownloaders muss jetzt unbedingt in der RSScrawler.ini hinterlegt werden.')
            print('Weiterhin sollten die Listen entsprechend der README.md gefüllt werden!')
            # Warte 10 Sekunden, damit Windows-Nutzer die Warnung lesen können
            time.sleep(10)
            print('Viel Spass! Beende RSScrawler!')
            sys.exit(0)
    
    # Prüfe, ob neue Einstellungen in RSScrawler vorhanden sind
    configfile = os.path.join(os.path.dirname(sys.argv[0]), 'Einstellungen/RSScrawler.ini')
    if not 'port' in open(configfile).read() and not 'prefix' in open(configfile).read() :
        print "Veraltete Konfigurationsdatei erkannt. Ergänze neue Einstellungen!"
        with open(os.path.join(os.path.dirname(sys.argv[0]), 'Einstellungen/RSScrawler.ini'), 'r+') as f:
            content = f.read()
            f.seek(0)
            f.truncate()
            f.write(content.replace('[RSScrawler]\n', '[RSScrawler]\nport = 9090\nprefix =\n'))
            
    # Definiere die allgemeinen Einstellungen global
    rsscrawler = RssConfig('RSScrawler')

    # Wenn JDPFAD als Argument vergeben wurde, ignoriere Konfigurationseintrag
    if arguments['--jd-pfad']:
    	jdownloaderpath = arguments['--jd-pfad']
    else:
    	jdownloaderpath = rsscrawler.get("jdownloader")
    # Sperre Pfad, wenn	als Docker gestartet wurde
    if arguments['--docker']:
       jdownloaderpath = '/jd2'
    # Ersetze Backslash durch Slash (für Windows)
    jdownloaderpath = jdownloaderpath.replace("\\", "/")
    # Entferne Slash, wenn jdownloaderpath darauf endet
    jdownloaderpath = jdownloaderpath[:-1] if jdownloaderpath.endswith('/') else jdownloaderpath

    # Konsolenhinweis bei docker-Parameter
    if arguments['--docker']:
       print('Docker-Modus: JDownloader-Pfad und Port können nur per Docker-Run angepasst werden!')
       
    # Abbrechen, wenn JDownloader Pfad nicht vergeben wurde
    if jdownloaderpath == 'Muss unbedingt vergeben werden!':
        print('Der Pfad des JDownloaders muss unbedingt in der RSScrawler.ini hinterlegt werden.')
        print('Weiterhin sollten die Listen entsprechend der README.md gefüllt werden!')
        # Warte 5 Sekunden, damit Windows-Nutzer die Warnung lesen können
        time.sleep(5)
        print('Beende RSScrawler...')
        sys.exit(0)
    
    # Zeige Pfad erst nach obigem Check    
    print('Nutze das "folderwatch" Unterverzeichnis von "' + jdownloaderpath + '" für Crawljobs')
        
    # Abbrechen, wenn JDownloader Pfad nicht existiert
    if not os.path.exists(jdownloaderpath):
        print('Der Pfad des JDownloaders existiert nicht.')
        # Warte 5 Sekunden, damit Windows-Nutzer die Warnung lesen können
        time.sleep(5)
        print('Beende RSScrawler...')
        sys.exit(0)

    # Abbrechen, wenn folderwatch Pfad im JDownloader Pfad nicht existiert
    if not os.path.exists(jdownloaderpath + "/folderwatch"):
        print('Der Pfad des JDownloaders enthält nicht das "folderwatch" Unterverzeichnis. Sicher, dass der Pfad stimmt?')
        # Warte 5 Sekunden, damit Windows-Nutzer die Warnung lesen können
        time.sleep(5)
        print('Beende RSScrawler...')
        sys.exit(0)
        
    # Lege Port und Pfad der Webanwendung entsprechend der RSScrawler.ini bzw. des Startparameters fest
    if arguments['--port']:
    	port = int(arguments['--port'])
    else:
    	port = port = int(rsscrawler.get("port"))
    # Sperre Port, wenn	als Docker gestartet wurde
    docker = '0'
    if arguments['--docker']:
       port = int('9090')
       docker = '1'
       
    prefix = rsscrawler.get("prefix")
    print('Der Webserver ist erreichbar unter ' + checkIp() +':' + str(port) + '/' + prefix)
    def g(port, prefix, docker):
        starten = cherry.Server()
        starten.start(port, prefix, docker)
    p = Process(target=g, args=(port, prefix, docker))
    # Starte Webanwendung
    p.start()
    checkFiles()

    # Diese Klassen werden periodisch ausgeführt    
    pool = [
        MB(),
        SJ(),
        SJregex(),
    ]

    # Hinweis, wie RSScrawler beendet werden kann
    print('Drücke [Strg] + [C] zum Beenden')
    
    # Sauberes Beenden (über STRG+C) ermöglichen
    def signal_handler(signal, frame):
        list([el.periodical.cancel() for el in pool])
        print('Beende RSScrawler...')
        p.terminate()
        sys.exit(0)
    signal.signal(signal.SIGINT, signal_handler)

    # Wenn testlauf gesetzt ist, führe RSScrawler nur einmalig aus:
    for el in pool:
        # Wenn also testlauf nicht gesetzt ist, aktiviere die wiederholte Ausführung
        if not arguments['--testlauf']:
            el.activate()
        # Starte unabhängig von testlauf das Script
        el.periodical_task()

    # Pausiere das Script für die festgelegte Zeit, nachdem es ausgeführt werde (bis zur nächsten Ausführung)
    if not arguments['--testlauf']:
        try:
            while True:
                signal.pause()
        except AttributeError:
            # signal.pause() fehlt in Windows. Schlafe daher für eine Sekunde
            while True:
              time.sleep(1)