Realtime Sign Language Recognizer Based on Deep Learning

一、簡介

動機

世界衛生組織預計 2025 年有近 25 億人有一定程度的聽力損失，且至少有 7 億人需要聽力康復。由於文字主要依靠聽覺來理解並記憶，文字溝通對聽障人士而言十分費勁。因此我們想讓聽障人士可以直接使用手語與一般聽人溝通，拉近彼此之間的距離。

目標

使用深度學習實作即時手語辨識系統，以臺灣使用的手語作為資料集。並結合文字轉語音與語音轉文字功能，使聽障人士與一般聽人皆能使用自己最熟悉的母語與彼此溝通。

二、技術方法

手語辨識

以深度學習實作，自行錄製手語動作作為資料集。使用MediaPipe偵測骨架座標，一個手語動作做一秒，並以30幀的速度紀錄動作變化，然後以30個frame的骨架座標作為一筆輸入資料，每個手語動作錄製180筆資料。最後以LSTM和GRU作為基礎模型架構來訓練，並比較不同模型的效能。

語音辨識 / 合成

語音辨識部分將即時錄製到的語音降噪後分段，再將分段的語音傳送到 Google API取得語音轉文字的結果。語音合成同樣使用Google API取得文字轉語音的結果。

Name		Name	Last commit message	Last commit date
Latest commit History 4 Commits
checkpoint		checkpoint
font		font
icon		icon
.gitignore		.gitignore
README.md		README.md
UI.py		UI.py
chatWidget.py		chatWidget.py
start.py		start.py
train.py		train.py

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Repository files navigation

Realtime Sign Language Recognizer Based on Deep Learning

一、簡介

動機

目標

二、技術方法

手語辨識

語音辨識 / 合成

三、系統架構

四、成果展示

手語辨識

語音辨識

About

Releases

Packages

Languages

ty0601/Realtime-Sign-Language-Recognizer-Based-on-Deep-Learning

Folders and files

Latest commit

History

Repository files navigation

Realtime Sign Language Recognizer Based on Deep Learning

一、簡介

動機

目標

二、技術方法

手語辨識

語音辨識 / 合成

三、系統架構

四、成果展示

手語辨識

語音辨識

About

Resources

Stars

Watchers

Forks

Releases

Packages 0

Languages

Packages