GitHub - dkiswanto/sentiment-analyzer-nltk-twitter

Simple Sentiment Analyzer with NLTK for Twitter

Tech Stack

Python 2.7
NLTK (Natural Language Processing Toolkit) 3.2.2
TwitterSearch

Web App Tech

Django 1.9.11
Semantic UI
JQuery

Step

Pre-processing :

Tokenization

Using : http://www.nltk.org/_modules/nltk/tokenize/casual.html#TweetTokenizer

Example : 
>>> from nltk.tokenize import TweetTokenizer
>>> tweet = "This is a cooool #dummysmiley: :-) :-P <3 and some arrows < > -> <--"
>>> TwitterTokenizer.tokenize(tweet)
['This', 'is', 'a', 'cooool', '#dummysmiley', ':', ':-)', ':-P', '<3', 'and', 'some', 'arrows', '<', '>', '->', '<--']

removing stop word

>>> from nltk.corpus import stopwords
>>> english_stops = set(stopwords.words('english'))
>>> "is" in english_stops
True
>>> "ganteng" in english_stops
False

Stemming Porter Algorithm

Algorithm : http://snowball.tartarus.org/algorithms/porter/stemmer.html

Simple Explanation :

1.a

$sses -> $ss | caresses -> caress

$ies -> $i | ponies -> poni

$ss -> $ss | caress -> caress

$s -> $ | cats -> cat

1.b

$(verb)-ing -> $(verb) | walking -> walk

$(verb)-ed -> $(verb) | walked -> walk

2.(for long stems)

$ational -> $ate | relational -> relate

$izer -> $ize | digitizer -> digitize

3.(for long stems)

$al -> $ | revival -> reviv

$able -> $ | adjustable -> adjust

lower_case using python built in .lower() method

>>> "TwitterPostTweet".lower()
"twitterposttweet"

Extraksi Feature

Using Binary term frequency.

>>> tweet = ["apple", "product", "best", "use", "apple", "forever"]
>>> "extraction_feature(tweet)
{"apple": True, "product": True, "best": True, "forever": True}

Classifier

Using NaiveBayesClassifier (NLTK),

Name		Name	Last commit message	Last commit date
Latest commit History 9 Commits
.idea		.idea
readme_files		readme_files
sentiment_analysis_nltk		sentiment_analysis_nltk
sentiment_app		sentiment_app
.gitignore		.gitignore
README.md		README.md
db.sqlite3		db.sqlite3
manage.py		manage.py

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Repository files navigation

Simple Sentiment Analyzer with NLTK for Twitter

Tech Stack

Web App Tech

Step

Pre-processing :

Extraksi Feature

Classifier

Screenshoot

About

Releases

Packages

Languages

dkiswanto/sentiment-analyzer-nltk-twitter

Folders and files

Latest commit

History

Repository files navigation

Simple Sentiment Analyzer with NLTK for Twitter

Tech Stack

Web App Tech

Step

Pre-processing :

Extraksi Feature

Classifier

Screenshoot

About

Resources

Stars

Watchers

Forks

Releases

Packages 0

Languages

Packages