main.py

import argparse
import time

import requests.exceptions
from mwcleric import AuthCredentials
from mwcleric import WikiggClient
from mwclient.page import Page


WIKIS = ['test:en']
IS_IMPORT = True  # don't overwrite & don't make mainspace pages
SKIP_CSS = False
START_AT_PAGE = None
START_AT_NAMESPACE = 0
SUBJECT_NAME = None
LOADOUT_WIKI = 'defaultloadout' # options include "defaultloadout", "mcmodloadout"


class Loadout:
    startat_namespace = 0
    startat_page = None
    # noinspection PyRedeclaration
    # startat_page = 'Template:License'
    is_import: bool
    skip_css: bool
    summary: str = 'Adding default set of pages'
    subject_name: str|None
    docpage: str = '/doc'

    def __init__(self,
                 target_name,
                 target_lang,
                 is_import,
                 skip_css,
                 start_at_page,
                 start_at_ns,
                 subject_name):
        self.passed_startat = False
        credentials = AuthCredentials(user_file="me")
        self.target_name = target_name
        self.target_lang = target_lang
        self.is_import = is_import
        self.skip_css = skip_css
        self.startat_page = start_at_page
        self.startat_namespace = start_at_ns
        self.loadout = WikiggClient(LOADOUT_WIKI, credentials=credentials)
        self.target = WikiggClient(target_name, credentials=credentials, lang=target_lang)

        self.subject_name = subject_name
        if subject_name is None:
            sitename: str = self.target.client.site['sitename']
            if sitename.endswith(' Wiki'):
                self.subject_name = sitename.removesuffix(' Wiki')

        self.docpage = '/doc'
        if target_lang is not None and target_lang != 'en':
            doc_page_name = self.target.localize('Scribunto-doc-page-name')
            print(doc_page_name)
            page, docpage = doc_page_name.split('/')
            self.docpage = '/' + docpage

    def run(self):
        self.copy()

    def copy(self):
        for ns in self.loadout.client.namespaces:
            print(f"Starting namespace {ns}")
            if ns <= self.startat_namespace - 1:  # ns 4 is Project ns
                continue
            if ns == 0:
                continue
            self.copy_namespace(ns)
        if not self.is_import:
            self.copy_namespace(0)
            return
        # for imported wikis
        self.move_old_mainpage()
        self.redirect_mainpage()
        self.add_user_migration_notes()
        self.copy_namespace(0)

    def copy_namespace(self, ns: int):
        for orig_page in self.loadout.client.allpages(namespace=ns):
            try:
                self.copy_page(orig_page, ns)
            except requests.exceptions.HTTPError:
                time.sleep(60)
                self.copy_page(orig_page, ns)

    def copy_page(self, orig_page: Page, ns: int):
        if self.startat_page == orig_page.name:
            self.passed_startat = True
        if self.startat_page is not None and not self.passed_startat:
            return
        if orig_page.name == 'File:Site-favicon.ico':
            # don't copy the favicon page, to avoid warnings when people upload it
            return
        print(orig_page.name)
        new_title = orig_page.name
        new_site_name = self.target.client.site['sitename']
        if ns == 4:
            new_title = f'Project:{orig_page.page_title}'
        if orig_page.base_name == self.loadout.client.site['mainpage']:
            new_title = orig_page.name.replace(self.loadout.client.site['mainpage'], new_site_name)
        if orig_page.name == 'Category:' + self.loadout.client.site['sitename']:
            new_title = 'Category:' + new_site_name
        if orig_page.namespace == 828 and orig_page.name.endswith('/doc'):
            new_title = new_title.replace('/doc', self.docpage)

        target_page = self.target.client.pages[new_title]
        do_save = False
        if not self.is_import:
            # if it's not an import we always do the save
            # except at page MediaWiki copyright, then we don't want to overwrite
            if new_title != 'MediaWiki:Copyright' or not target_page.exists:
                do_save = True
        elif new_title in ['MediaWiki:Common.css', 'MediaWiki:Vector.css']:
            if not self.skip_css:
                do_save = True
        elif not target_page.exists and new_title != 'MediaWiki:Copyright':
            do_save = True
        elif ns == 0:
            # overwrite the main page + imp pages
            do_save = True
        if do_save:
            self.save(target_page, orig_page)

    def save(self, target_page: Page, orig_page: Page):
        text = orig_page.text()
        if self.subject_name is not None:
            text = text.replace('SUBJECTNAME', self.subject_name)
        if target_page.name == 'Main Page':
            target_mainpage_name = self.target.client.site['sitename']
            text = f'#redirect [[{target_mainpage_name}]]'
        self.target.save(target_page, text, summary=self.summary)
        protections = '|'.join([f'{k}={v[0]}' for k, v in orig_page.protection.items()])
        if protections != '':
            try:
                self.target.protect(target_page, protections=protections)
            except Exception as e:
                pass

    def move_old_mainpage(self):
        orig_page_name = self.target.client.site['mainpage']
        new_page_name = self.target.client.site['sitename']
        if orig_page_name == new_page_name:
            return
        if (orig_page := self.target.client.pages[orig_page_name]).exists:
            if (wrong_orig_page := self.target.client.pages[new_page_name]).exists:
                wrong_orig_page.delete("Making way for existing main page")
            self.target.move(orig_page, new_page_name)
        self.target.client.pages['MediaWiki:mainpage'].save('{{SITENAME}}', 'renaming main page to SITENAME')

    def redirect_mainpage(self):
        mainpage = self.target.client.pages['Main Page']
        if 'MediaWiki has been installed' in mainpage.text():
            target_mainpage_name = self.target.client.site['sitename']
            text = f'#redirect [[{target_mainpage_name}]]'
            self.target.save(mainpage, text)

    def add_user_migration_notes(self):
        text = '{{int:wikigg-fork-reclaim-note}}'
        for page_title in ('MediaWiki:Loginprompt', 'MediaWiki:Signupstart'):
            page = Page(self.target.client, page_title)
            self.target.save(page, text, summary=self.summary)


if __name__ == '__main__':
    parser = argparse.ArgumentParser()
    parser.add_argument('-i', '--is-import', action='store_true', default=IS_IMPORT)
    parser.add_argument('-s', '--skip-css', action='store_true', default=SKIP_CSS)
    parser.add_argument('-p', '--from-page', type=str, default=START_AT_PAGE)
    parser.add_argument('-n', '--from-namespace', type=int, default=START_AT_NAMESPACE)
    parser.add_argument('wikis', nargs='*', default=WIKIS)
    args = parser.parse_args()

    common_bot_args = dict(
        is_import=args.is_import,
        skip_css=args.skip_css,
        start_at_page=args.from_page,
        start_at_ns=args.from_namespace,
    )

    for wiki in args.wikis:
        name, lang = wiki, None
        if ':' in wiki:
            name, lang = wiki.split(':')
        Loadout(name, lang, subject_name=SUBJECT_NAME, **common_bot_args).run()