Skip to content

cstdr/ChatGPTAssistant

Repository files navigation

ChatGPT助手

项目背景

一个基于 OpenAI API 的Android 语音助手,模型为"gpt-3.5-turbo"。

因为当时没有带语音功能的AI助手,并且需要科技,所以就自己做了一个。

2023.8.21更新:

  • 反向代理服务器经常失败,换回OpenAI直连,需要配合科技使用。
  • 后面考虑使用中间件调用其他模型。

功能

  1. 基于 ChatGPT 3.5 的聊天功能,温度设置为 0.5 ,其他默认设置,没有初始角色设定。
  2. 可以语音输入,使用讯飞语音。默认GPT语音播报回答。语音播报可以停止。
  3. 支持上下文理解,可以多轮对话,比如扮演面试官角色进行面试沟通。
  4. 不需要科技可以直接使用。(7月失效)

使用

以下使用到的API均可免费申请:

  1. 申请 OpenAI API key:https://platform.openai.com/account/api-keys
  2. 申请讯飞语音 API key:https://console.xfyun.cn/app/myapp
  3. 项目代码中创建接口,把自己申请的Key写入即可。
package com.cstdr.chatgpt.model;

public interface API {
    String OPEN_AI = "sk-xxxx"; // Open AI
    String XF_SPEECH = "xxxx"; // 讯飞语音
}

App截图

技术方案

1.语音识别

目前考虑的方案:

  1. 科大讯飞(目前使用中)
  • 免费的话,语音听写和在线语音合成一年5万次交互量。
  1. 百度云、阿里云、腾讯云等云平台提供的功能

废弃的方案:

  1. 谷歌原生的语音识别(项目代码还在,已经注释)

优点:代码集成简单,维护方便。

缺点:使用需要科学魔法,可能会影响ChatGPT的沟通效率。后续扩展或者加入个性化语音需求比较麻烦。

  1. PocketSphinx on Android (https://cmusphinx.github.io/wiki/tutorialandroid/)

优点:离线语音识别,网上教程多。

缺点:集成有点复杂,并且没有个性化语音功能,很多教程都比较久远,维护难度大。

  1. 微软Azure(https://azure.microsoft.com/zh-cn/products/cognitive-services/speech-services/)
  • 免费版本:每月 5 小时免费音频,永久免费。
  • 注册需要VISA卡。 最后卡在VISA注册上,卡激活没问题,持卡人签名那边尝试各种办法怎么都过不去。。。

About

一个基于 ChatGPT API 的Android 语音助手

Topics

Resources

License

Stars

Watchers

Forks

Releases

No releases published

Packages

No packages published

Languages