wikipedia-scraper

A complete Python text analytics package that allows users to search for a Wikipedia article, scrape it, conduct basic text analytics and integrate it to a data pipeline without writing excessive code.

wikipedia wikipedia-api text-analytics wikipedia-article wikipedia-search wikipedia-corpus wikipedia-scraper

Updated Dec 8, 2022
Python

moesalih / spacex.moesalih.com

Star

SpaceX Launches 🚀 and Starlink Satellites 🛰

firebase serverless wikipedia nextjs mustache google-cloud-platform spacex wikipedia-scraper spacex-launches starlink

Updated Mar 4, 2023
JavaScript

OlehOnyshchak / pyWikiMM

Star

Collects a multimodal dataset of Wikipedia articles and their images

Updated Mar 25, 2023
Python

marian-code / wikipedia-music-tags

Star

Music tagger with GUI that parses wikipedia for information. Can also download album art and lyrics.

gui pyqt5 music-information-retrieval python-3 pyside2 console-application pyinstaller album-art music-tagger wikipedia-scraper music-tagging lyrics-fetcher lyrics-search

Updated Jun 8, 2020
Python

attogram / justrefs

Sponsor

Star

Just Refs - extract just the references and related topics from any page on the English Wikipedia

wikipedia information-extraction wikipedia-api data-extraction wikipedia-viewer wikipedia-scraper

Updated May 18, 2020
PHP

ThiagoNelsi / wikipedia-to-document

Star

This project collects Wikipedia articles from a search term entered by the user and formats the data into a .docx (Word Document) document with images related to each section of the collected article.

api open-source automation robot google-custom-search wikipedia microsoft-word scraping wikipedia-api docx ibm google-cloud-platform ibm-watson docx-generator algorithmia wikipedia-scraper video-maker microsoft-word-automation filipe-deschamps

Updated Jan 5, 2023
JavaScript

kohjiaxuan / NLP-Model-for-Corpus-Similarity

Star

A NLP algorithm I developed to determine the similarity or relation between two documents/Wikipedia articles. Inspired by the cosine similarity algorithm and built from WordNet.

nlp wikipedia cosine-similarity text-analytics nlp-machine-learning similarity-score wikipedia-scraper nlp-model nltk-similarity corpus-similarity

Updated May 19, 2020
Python

oxylabs / web-scraping-php

Star

A tutorial and code samples of web scraping with PHP

php web-scraping url-scraper screen-scraping website-crawler email-scraper wikipedia-scraper email-scraper-with-proxy

Updated Apr 19, 2024
PHP

emreYbs / Wikipedia-Article-Summarizer

Star

Wikipedia Article Summarizer a simple Python project based on NLP techniques

python nlp machine-learning natural-language-processing jupyter jupyter-notebook python3 nltk summarization nlp-machine-learning wikipedia-scraper nltk-python article-summarization

Updated Feb 23, 2024
Jupyter Notebook

shanedrabing / taxopedia

Star

Taxonomic trees (cladograms) from Wikipedia-scraped data.

taxonomy wikipedia phylogenetic-trees phylogenetics wikipedia-scraper cladogram taxonomic-trees

Updated Dec 22, 2021
Python

mynlp / wikilex

Star

Wikipedia Entities Lexicon Extractor

disambiguation lexicon entity-extraction wikipedia-database wikipedia-scraper

Updated Oct 26, 2017
Python

donomii / wikipedia2geojson

Star

Extracts geodata from a wikipedia dump

converter json geojson mapping wikipedia conversion geodata geotagged-wikipedia-articles wikipedia-dump geotagging wikipedia-scraper

Updated May 15, 2024
Go

lorenzoranucci / sentimantic

Star

Linked Data Knowledge Base Population (KBP) framework built on top of Snorkel. The default configuration uses Wikipedia as text corpus and DBpedia as target.

nlp docker natural-language-processing linked-data information-extraction weak-supervision linked-data-quality-assessment relation-extraction weakly-supervised-learning distant-supervision wikipedia-scraper knowledge-base-population knowledge-base-construction

Updated Nov 23, 2019
Python

orange-soda / scrapy-wikipedia

Star

维基百科中文网历史事件爬取Python实现，并通过LaTeX导出为PDF

python wikipedia-scraper

Updated Sep 23, 2018
TeX

Improve this page

Add a description, image, and links to the wikipedia-scraper topic page so that developers can more easily learn about it.

Curate this topic

Add this topic to your repo

To associate your repository with the wikipedia-scraper topic, visit your repo's landing page and select "manage topics."

Learn more

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

wikipedia-scraper

Here are 107 public repositories matching this topic...

martin-majlis / Wikipedia-API

oxylabs / web-scraping-tutorials

lehinevych / MediaWikiAPI

viralvaghela / Jwiki

themagicalmammal / wikibot

Louis3797 / wikipedia-graph

kohjiaxuan / Wikipedia-Article-Scraper

moesalih / spacex.moesalih.com

OlehOnyshchak / pyWikiMM

marian-code / wikipedia-music-tags

attogram / justrefs

ThiagoNelsi / wikipedia-to-document

kohjiaxuan / NLP-Model-for-Corpus-Similarity

oxylabs / web-scraping-php

emreYbs / Wikipedia-Article-Summarizer

shanedrabing / taxopedia

mynlp / wikilex

donomii / wikipedia2geojson

lorenzoranucci / sentimantic

orange-soda / scrapy-wikipedia

Improve this page

Add this topic to your repo