diff --git a/get_revisions/wikipedia_revisions_ingester.py b/get_revisions/wikipedia_revisions_ingester.py
deleted file mode 100644
index 7cde7529..00000000
--- a/get_revisions/wikipedia_revisions_ingester.py
+++ /dev/null
@@ -1,121 +0,0 @@
-"""wikipedia_revisions_ingester.
-
-Read in Wikipedia raw revisions output them to stdout in json format.
-"""
-
-from __future__ import absolute_import
-from __future__ import division
-from __future__ import print_function
-
-import json
-import subprocess
-import xml.sax
-import xml_path
-import argparse
-
-
-parser = argparse.ArgumentParser(description='Download and save wikipedia revisions from a dump.')
-parser.add_argument('-i', '--input',  required=True, help='Path to a wikipedia xml or 7z revision dump file.')
-
-args = parser.parse_args()
-TALK_PAGE_NAMESPACE = [1, 3, 5, 7, 9, 11, 13, 15] 
-
-class ParserContentHandler(xml.sax.ContentHandler):
-  """Content handler using a minimal incremental combinator parser."""
-
-  def __init__(self, data_reset_path, data_paths, revision_reset_path):
-    xml.sax.ContentHandler.__init__(self)
-    # The path through the XML to get to where we currently are.
-    self.xml_path = xml_path.XmlPath()
-    self.data = {}
-    self.data_reset_path = data_reset_path
-    self.data_paths = data_paths
-    self.revision_reset_path = revision_reset_path
-    self.page_data = {}
-
-  def startElement(self, name, attrs):
-    self.xml_path.enter(name)
-    # print('# START: ' + str(self.xml_path))
-
-  def endElement(self, name):
-    # print('# END: ' + str(self.xml_path))
-    if self.xml_path.element_path_eq(self.revision_reset_path):
-       if int(self.page_data['page_namespace']) in TALK_PAGE_NAMESPACE:
-          if 'revisions' not in self.page_data: self.page_data['revisions'] = [] 
-          if 'user_ip' in self.data:
-             self.data['user_id'] = -1
-             self.data['user_text'] = self.data['user_ip'] 
-          if not('text' in self.data):
-             self.data['text'] = ""
-          if not('user_id' in self.data):
-             self.data['user_id'] = None
-             self.data['user_text'] = None
-          self.page_data['revisions'].append(self.data)
-          self.data = {} 
-       
-    if self.xml_path.element_path_eq(self.data_reset_path):
-      if int(self.page_data['page_namespace']) in TALK_PAGE_NAMESPACE: 
-         print(json.dumps(self.page_data))
-      self.page_data = {}
-    self.xml_path.exit()
-
-  def characters(self, content_text):
-    self.xml_path.add_line_of_content()
-    if not('page_namespace' in self.page_data) or \
-       int(self.page_data['page_namespace']) in TALK_PAGE_NAMESPACE:
-       for data_name, data_path in self.data_paths:
-         if self.xml_path.element_path_eq(data_path):
-           if 'page' in data_name:
-              if data_name not in self.page_data:
-                 self.page_data[data_name] = ""
-              self.page_data[data_name] += content_text
-           else:
-              if data_name not in self.data:
-                 self.data[data_name] = ""
-              self.data[data_name] += content_text
-    # print('# CONTENT: ' + str(self.xml_path))
-
-
-def main():
-  data_reset_path = xml_path.XmlPath().enter_many(['mediawiki', 'page'])
-  revision_reset_path = xml_path.XmlPath().enter_many(['mediawiki', 'page', 'revision']) 
-  data_paths = [
-      ('comment', xml_path.XmlPath().enter_many(
-          ['mediawiki', 'page', 'revision', 'comment'])),
-      ('format', xml_path.XmlPath().enter_many(
-          ['mediawiki', 'page', 'revision', 'format'])),
-      ('model', xml_path.XmlPath().enter_many(
-          ['mediawiki', 'page', 'revision', 'model'])),
-      ('page_id', xml_path.XmlPath().enter_many(['mediawiki', 'page', 'id'])),
-      ('page_namespace',
-       xml_path.XmlPath().enter_many(['mediawiki', 'page', 'ns'])),
-      ('page_title',
-       xml_path.XmlPath().enter_many(['mediawiki', 'page', 'title'])),
-      ('rev_id',
-       xml_path.XmlPath().enter_many(['mediawiki', 'page', 'revision', 'id'])),
-      ('timestamp', xml_path.XmlPath().enter_many(
-          ['mediawiki', 'page', 'revision', 'timestamp'])),
-      ('sha1', xml_path.XmlPath().enter_many(
-          ['mediawiki', 'page', 'revision', 'sha1'])),
-      ('text', xml_path.XmlPath().enter_many(
-          ['mediawiki', 'page', 'revision', 'text'])),
-      ('user_id', xml_path.XmlPath().enter_many(
-          ['mediawiki', 'page', 'revision', 'contributor', 'id'])),
-      ('user_text', xml_path.XmlPath().enter_many(
-          ['mediawiki', 'page', 'revision', 'contributor', 'username'])),
-      ('user_ip', xml_path.XmlPath().enter_many(
-          ['mediawiki', 'page', 'revision', 'contributor', 'ip'])),
-
-  ]
-  content_handler = ParserContentHandler(
-      data_reset_path=data_reset_path, data_paths=data_paths, revision_reset_path=revision_reset_path)
-
-  cmd = (['7z', 'x', args.input, '-so']
-         if args.input.endswith('.7z') else ['cat', args.input])
-  p = subprocess.Popen(cmd, stdout=subprocess.PIPE)
-  if not(p.stdout == ""):
-      xml.sax.parse(p.stdout, content_handler)
-
-
-if __name__ == '__main__':
-  main()
diff --git a/get_revisions/xml_path.pyc b/get_revisions/xml_path.pyc
deleted file mode 100644
index f9ff0c8d..00000000
Binary files a/get_revisions/xml_path.pyc and /dev/null differ