O Sora da OpenAI foi oficialmente lançado , seu modelo de inteligência artificial voltado para a criação de vídeos realistas a partir de descrições de texto, imagens estáticas ou até mesmo vídeos pré-existentes. A tecnologia já está disponível para assinantes dos planos Plus e Pro do ChatGPT, oferecendo novas possibilidades para profissionais criativos e gerando debates sobre seu impacto na indústria audiovisual.
Disponível em uma versão de testes desde o início do ano, a inteligência artificial geradora de vídeos da OpenAI agora está liberada para os assinantes das versões pagas do ChatGPT.
Usando o Sora
Para facilitar a interação com a Sora, a OpenAI adicionou botões de controle à interface tradicional do ChatGPT. É possível, por exemplo, escolher predefinições de visual, como a estética de uma animação ou de um filme de época.
O usuário também pode unir diferentes clipes gerados em uma sequência, dando continuidade as cenas criadas pela IA e podendo editar a ordem delas. Também há a opção de pedir alterações nos resultados anteriores usando comandos de texto.
O Sora Turbo, versão otimizada apresentada pela OpenAI, promete desempenho superior ao protótipo inicial divulgado no início de 2024. Com suporte para vídeos em resolução de até 1080p e duração de até 20 segundos, a ferramenta está mais rápida e eficiente, reduzindo o tempo de espera para os usuários, destaca a companhia.
Uma das principais novidades do Sora é a integração de ferramentas avançadas para personalização de conteúdo. Entre elas estão:
- Storyboards: permitem que os usuários controlem com precisão cada quadro do vídeo, garantindo maior coerência e criatividade.
- Remixagem e combinação de materiais: ideal para criar conteúdo único a partir de imagens ou vídeos diferentes.
- Animação de imagens estáticas: transforma fotos ou ilustrações em vídeos dinâmicos.
- Extensão de vídeos existentes: adiciona quadros ou estende a duração de vídeos já criados.
Formatos do Sora
Os vídeos podem ser gerados em formatos como widescreen, retrato e quadrado, atendendo às demandas de diferentes plataformas e redes sociais. Além disso, a seção “Explorar” permite que os usuários interajam com conteúdos criados pela comunidade, incentivando a troca de ideias.
A tecnologia do Sora
Assim como o modelo de geração de imagens DALL·E, o Sora utiliza um processo de difusão para transformar ruído aleatório em vídeos realistas. A arquitetura se baseia em transformadores, a mesma tecnologia que alimenta os modelos GPT. Um diferencial é o uso da técnica de recaptação, introduzida no DALL·E 3, que melhora a compreensão das instruções textuais fornecidas pelos usuários.
Em relação a base de dados para o treinamento da IA, a OpenAI menciona o seguinte:
- Dados públicos de repositórios de aprendizado de máquina e rastreamento da web.
- Dados proprietários, fornecidos por parcerias com plataformas como Shutterstock e Pond5.
- Conjuntos personalizados, desenvolvidos internamente.
- Feedback humano, coletado de artistas e criadores durante a fase de testes.
A OpenAI também implementou filtros rigorosos para excluir conteúdo explícito ou sensível, seguindo padrões aplicados em modelos anteriores.
Uso e valores
Segundo a OpenAI, os assinantes do pacote ChatGPT Plus, vendido a US$ 20 (R$ 121,13) por mês, poderão gerar até 50 vídeos mensais, com no máximo cinco segundos de duração e resolução de 720 p. O plano ChatGPT Pro, anunciado na última sexta-feira (6) custando US$ 200 (R$ 1.211,28), permitirá criar 500 vídeos de até 20 segundos, com a possibilidade de fazer cinco pedidos de uma só vez.
O plano mais caro ainda permitirá retirar a marca d’água do vídeo. Até agora, a Sora estava disponível apenas para produtores de vídeos selecionados, por questões de segurança, de acordo com a desenvolvedora.
Desafios e Considerações Éticas
Apesar dos inúmeros benefícios, o uso do Sora OpenAI também levanta questões éticas importantes. A privacidade dos dados dos usuários, a transparência nas interações e o potencial de uso indevido da tecnologia são áreas que requerem atenção cuidadosa. também é fundamental levantarmos as questões de direitos autorais e sucateamento do trabalho artistico. Vamos ficar atentos!