Machine Learning for Sequential Data

Outline

Hidden Markov Model
Word2Vec
Neural Temporal Point Processes
Hate speech detection
Toxic speech classification

Hidden Markov Model

Implemented Hidden Markov Model (HMM) to generate and classify reviews

Word2Vec

Implemented Word2Vec to obtain word embeddings

Neural Temporal Point Processes

Implemented Neural Temporal Point Processes to model the time of occurrence of events

Hate Speech Detection

Implemented a Fully Connected Neural Network to detect hate speech in tweets.

Tweets labels: RACIST, SEXIST, NEITHER
Data Preprocessing
- LabelEncoder for labels
- Universal Sentence Encoder to get text embeddings

Toxic Speech Classification

Employed DistilBERT to classify tweets to detec toxic speech.

Tweets labels: none, racism, sexism
Data Preprocessing
- LabelEncoder for labels
- BertTokenizer to get text tokens
- padding
- CustomDataset
- Split to Train/Val/Test 60/20/20
Model: DistilBERT
Explanation using SHAP

Name		Name	Last commit message	Last commit date
Latest commit History 16 Commits
ex1		ex1
ex2		ex2
ex3		ex3
ex4		ex4
ex5		ex5
ex6		ex6
.gitattributes		.gitattributes
.gitignore		.gitignore
README.md		README.md

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Repository files navigation

Machine Learning for Sequential Data

Outline

Hidden Markov Model

Word2Vec

Neural Temporal Point Processes

Hate Speech Detection

Toxic Speech Classification

About

Releases

Packages

Languages

msskzx/ml-sequential

Folders and files

Latest commit

History

Repository files navigation

Machine Learning for Sequential Data

Outline

Hidden Markov Model

Word2Vec

Neural Temporal Point Processes

Hate Speech Detection

Toxic Speech Classification

About

Resources

Stars

Watchers

Forks

Releases

Packages 0

Languages

Packages