简易的即梦绘图插件,支持AI图片生成和文本转语音功能。可以选择比例和模型,每天领取66积分可以画66张图片。画图效果和豆包差不多,同时集成了Azure语音服务进行TTS转换。
- ✅ AI图片生成(支持多种模型和比例)
- ✅ 文本转语音(TTS)和字幕生成
- ✅ 批量处理飞镜配置
- ✅ 命令行参数控制
- ✅ 数据库存储和图片管理
- ✅ 详细的日志记录
# 激活虚拟环境(如果有)
conda activate jimeng
# 安装依赖
pip install azure-cognitiveservices-speech
pip install requests pillow python-dotenv
创建 config.json
文件:
{
"api": {
"base_url": "https://jimeng.jianying.com",
"aid": 513695,
"app_version": "5.8.0",
"request_delay": 1.0
},
"video_api": {
"cookie": "your_cookie_here",
"sign": "your_sign_here",
"msToken": "your_msToken_here",
"a_bogus": "your_a_bogus_here"
},
"params": {
"default_model": "3.1",
"default_ratio": "9:16",
"models": {
"3.1": {
"model_req_key": "high_aes_general_v30l_art_fangzhou:general_v3.0_18b",
"ratios": "v3_ratios"
}
},
"v3_ratios": {
"9:16": {
"width": 576,
"height": 1024
},
"16:9": {
"width": 1024,
"height": 576
},
"1:1": {
"width": 1024,
"height": 1024
}
}
},
"storage": {
"retention_days": 7
},
"generation": {
"max_retries": 3,
"retry_delay": 2,
"timeout": 30
}
}
设置Azure语音服务(用于TTS功能):
export SPEECH_KEY="your_azure_speech_key"
export ENDPOINT="https://your_region.api.cognitive.microsoft.com"
python jimeng.py [选项]
选项 | 说明 |
---|---|
--tts |
执行飞镜转TTS功能 |
--batch |
执行批量图片生成功能 |
--download |
从数据库下载飞镜图片 |
--stats |
只显示统计信息 |
选项 | 默认值 | 说明 |
---|---|---|
--config |
config.json |
指定配置文件路径 |
--feijing |
feijing.json |
指定飞镜配置文件路径 |
--voice |
zh-CN-YunzeNeural |
指定TTS语音名称 |
--model |
3.1 |
指定图片生成模型 |
--ratio |
9:16 |
指定图片比例 |
--timeout |
3600 |
图片生成超时时间(秒) |
python jimeng.py --tts
python jimeng.py --batch
python jimeng.py --tts --batch
python jimeng.py --tts --voice zh-CN-XiaoxiaoNeural
python jimeng.py --batch --model 2.1 --ratio 16:9
python jimeng.py --batch --timeout 1800
python jimeng.py --download
python jimeng.py --stats
python jimeng.py --tts --feijing custom_feijing.json
python jimeng.py --config config.json --feijing feijing.json
python jimeng.py
创建 feijing.json
文件来配置飞镜项目。您可以通过 --feijing
参数指定自定义的飞镜配置文件路径:
[
{
"编号": "分镜1",
"提示词": "一个美丽的风景画",
"原文": "这是分镜1的文本内容"
},
{
"编号": "分镜2",
"提示词": "一只可爱的小猫",
"原文": "这是分镜2的文本内容"
}
]
配置文件字段说明:
编号
: 分镜的唯一标识符,用于生成文件名提示词
: 用于AI图片生成的描述文本原文
: 用于TTS语音合成的文本内容
使用自定义配置文件:
# 使用自定义飞镜配置文件进行TTS
python jimeng.py --tts --feijing my_feijing.json
# 使用自定义飞镜配置文件进行批量图片生成
python jimeng.py --batch --feijing my_feijing.json
# 同时指定配置文件和飞镜文件
python jimeng.py --config config.json --feijing feijing.json
zh-CN-YunzeNeural
- 云泽(男声,默认)zh-CN-XiaoxiaoNeural
- 晓晓(女声)zh-CN-YunxiNeural
- 云希(男声)zh-CN-XiaoyiNeural
- 晓伊(女声)zh-CN-YunjianNeural
- 云健(男声)
3.1
- 最新模型(默认)3.0
- 稳定版本2.1
- 经典版本2.0
- 基础版本2.0p
- 专业版本
9:16
- 竖屏(默认)16:9
- 横屏1:1
- 正方形4:3
- 传统比例3:4
- 竖屏传统比例
- 音频文件:
./downloads/{编号}.mp3
- 字幕文件:
./downloads/{编号}.srt
- 图片文件:
./downloads/{编号}_0.jpeg
,./downloads/{编号}_1.jpeg
等
jimeng/
├── jimeng.py # 主程序文件
├── config.json # 配置文件
├── feijing.json # 飞镜配置文件
├── module/ # 模块目录
│ ├── __init__.py
│ ├── api_client.py # API客户端
│ ├── audio_processor.py # 音频处理器
│ ├── image_processor.py # 图片处理器
│ ├── image_storage.py # 图片存储
│ ├── submaker.py # 字幕生成器
│ └── token_manager.py # Token管理器
├── storage/ # 存储目录
├── downloads/ # 下载目录
├── logs/ # 日志目录
└── temp/ # 临时目录
- 积分限制:每天领取66积分可以画66张图片
- 网络连接:确保能够访问即梦API和Azure语音服务
- 磁盘空间:确保有足够的磁盘空间存储生成的文件
- 权限:确保有写入文件的权限
- 配额限制:注意Azure语音服务的配额限制
- 配置文件:确保飞镜配置文件的JSON格式正确,包含必要的字段
- 文件路径:使用
--feijing
参数时,确保指定的文件路径存在且可读
- 增加上传图片参考图生成视频,可以选择模型和比例
- 修复生图提取模型和比例有错误问题
- 优化批量处理性能
- 添加更多语音选项
- 支持更多图片格式
- 支持飞镜配置文件的动态加载和热更新
- 添加配置文件验证和错误提示功能
查看完整的帮助信息:
python jimeng.py --help
本项目仅供学习和研究使用。