RapidClip é um projeto em andamento que busca automatizar a criação de vídeos curtos, ideais para plataformas como YouTube Shorts, Instagram Reels, TikTok e Kwai. O objetivo é permitir que o sistema gere vídeos completos a partir de um tema fornecido, combinando narração, música de fundo, imagens dinâmicas, efeitos visuais e legendas sincronizadas.
- Criação Automática de Conteúdo: Gerar roteiros personalizados com base no tema fornecido.
- Narração de Áudio: Transformar o roteiro em narração de alta qualidade.
- Reprocessamento de Áudio: Reprocessar áudios que excedam uma duração especificada para garantir compatibilidade com as restrições da plataforma.
- Geração de Legendas: Gerar legendas com alinhamento e segmentação aprimorados:
- Tokeniza o texto transcrito, preservando a pontuação.
- Alinha palavras com seus respectivos timestamps e pontuações.
- Cria legendas legíveis e sincronizadas com limites de caracteres e palavras por linha.
- Suporte a Múltiplos Idiomas: Permitir criação de conteúdo, narração e legendas em vários idiomas.
- Integração de Música de Fundo: Selecionar trilhas sonoras locais para enriquecer o vídeo.
- Imagens Relevantes: Gerar automaticamente imagens para ilustrar o conteúdo.
- Efeitos Visuais e Transições: Aplicar zoom, animações e cortes suaves.
- Renderização Completa: Criar o vídeo final pronto para publicação.
Antes de executar o RapidClip, certifique-se de configurar as variáveis de ambiente necessárias. Utilize o arquivo .env.example
como base e crie um arquivo .env
com as seguintes variáveis:
OPENAI_API_KEY=your-openai-api-key
ELEVENLABS_API_KEY=your-elevenlabs-api-key
Após configurar as variáveis, você pode executar o RapidClip usando o seguinte comando:
python src/main.py --theme "Curiosidades da História (uma única curiosidade)" --language "pt-BR" --voice_id "CstacWqMhJQlnfLPxRG4" --max_duration 60
--theme
: O tema do roteiro a ser criado.--language
: O idioma para o roteiro e narração.--voice_id
: O ID da voz a ser usada para a narração (compatível com ElevenLabs).--max_duration
: A duração máxima permitida para o áudio (em segundos).
Os arquivos gerados serão salvos na pasta output/
, incluindo:
- Um arquivo de áudio (
.mp3
) contendo a narração. - Um arquivo de legendas (
.srt
) sincronizado com o áudio.
O processo de geração de legendas garante alinhamento e legibilidade aprimorados:
- Tokenização com Pontuação: O texto transcrito completo é tokenizado em palavras e pontuações, preservando a ordem original.
- Alinhamento de Palavras e Pontuação: Cada palavra é alinhada com seu respectivo token, garantindo que a pontuação esteja corretamente posicionada.
- Segmentação de Cues: As legendas são divididas em segmentos menores (cues) com base em limites de palavras e caracteres por linha, mantendo a sincronização com os timestamps do áudio.
RapidClip está em sua fase inicial de desenvolvimento. As funcionalidades estão sendo implementadas e testadas para garantir um fluxo de trabalho eficiente e intuitivo.
- Estruturar o pipeline para criação de roteiros, narração e geração de imagens.
- Implementar efeitos visuais e transições entre imagens.
- Garantir a sincronização precisa entre áudio, imagens e legendas.
- Otimizar a renderização final para garantir compatibilidade com plataformas de vídeos curtos.
- Expandir o suporte ao processamento de áudio, incluindo reprocessamento de arquivos longos e gerenciamento de limites definidos pelo usuário.
Estamos abertos a contribuições! Caso queira colaborar com o projeto, siga estas etapas:
- Faça um fork do repositório.
- Crie uma branch para sua funcionalidade ou correção de bug:
git checkout -b minha-contribuicao
- Realize suas alterações e envie um pull request detalhando suas modificações.
Adoraríamos contar com sua ajuda para tornar o RapidClip ainda melhor!
Este projeto está licenciado sob a licença MIT. Isso significa que você pode usá-lo, modificá-lo e distribuí-lo, desde que a licença original seja incluída no código. Veja o arquivo LICENSE para mais detalhes.