Sora, a ferramenta IA de vídeo generativa da OpenAI

O Sora da OpenAI foi oficialmente lançado , seu modelo de inteligência artificial voltado para a criação de vídeos realistas a partir de descrições de texto, imagens estáticas ou até mesmo vídeos pré-existentes. A tecnologia já está disponível para assinantes dos planos Plus e Pro do ChatGPT, oferecendo novas possibilidades para profissionais criativos e gerando debates sobre seu impacto na indústria audiovisual.

Disponível em uma versão de testes desde o início do ano, a inteligência artificial geradora de vídeos da OpenAI agora está liberada para os assinantes das versões pagas do ChatGPT.

Usando o Sora

Antes de mais nada, para facilitar a interação com a Sora, a OpenAI adicionou botões de controle à interface tradicional do ChatGPT. É possível, por exemplo, escolher predefinições de visual, como a estética de uma animação ou de um filme de época.

Além disso, o usuário também pode unir diferentes clipes gerados em uma sequência, dando continuidade as cenas criadas pela IA e podendo editar a ordem delas. Também há a opção de pedir alterações nos resultados anteriores usando comandos de texto.

O Sora Turbo, versão otimizada apresentada pela OpenAI, promete desempenho superior ao protótipo inicial divulgado no início de 2024. Com suporte para vídeos em resolução de até 1080p e duração de até 20 segundos, a ferramenta está mais rápida e eficiente, reduzindo o tempo de espera para os usuários, destaca a companhia.

Uma das principais novidades do Sora é a integração de ferramentas avançadas para personalização de conteúdo. Entre elas estão:

  • Storyboards: permitem que os usuários controlem com precisão cada quadro do vídeo, garantindo maior coerência e criatividade.
  • Remixagem e combinação de materiais: ideal para criar conteúdo único a partir de imagens ou vídeos diferentes.
  • Animação de imagens estáticas: transforma fotos ou ilustrações em vídeos dinâmicos.
  • Extensão de vídeos existentes: adiciona quadros ou estende a duração de vídeos já criados.

Formatos do Sora

Os vídeos podem ser gerados em formatos como widescreen, retrato e quadrado, atendendo às demandas de diferentes plataformas e redes sociais. Além disso, a seção “Explorar” permite que os usuários interajam com conteúdos criados pela comunidade, incentivando a troca de ideias.

A tecnologia do Sora

Assim como o modelo de geração de imagens DALL·E, o Sora utiliza um processo de difusão para transformar ruído aleatório em vídeos realistas. A arquitetura se baseia em transformadores, a mesma tecnologia que alimenta os modelos GPT. Um diferencial é o uso da técnica de recaptação, introduzida no DALL·E 3, que melhora a compreensão das instruções textuais fornecidas pelos usuários.

Em relação a base de dados para o treinamento da IA, a OpenAI menciona o seguinte:

  • Dados públicos de repositórios de aprendizado de máquina e rastreamento da web.
  • Dados proprietários, fornecidos por parcerias com plataformas como Shutterstock e Pond5.
  • Conjuntos personalizados, desenvolvidos internamente.
  • Feedback humano, coletado de artistas e criadores durante a fase de testes.

A OpenAI também implementou filtros rigorosos para excluir conteúdo explícito ou sensível, seguindo padrões aplicados em modelos anteriores.

Uso e valores

Segundo a OpenAI, os assinantes do pacote ChatGPT Plus, vendido a US$ 20 (R$ 121,13) por mês, poderão gerar até 50 vídeos mensais, com no máximo cinco segundos de duração e resolução de 720 p. O plano ChatGPT Pro, anunciado na última sexta-feira (6) custando US$ 200 (R$ 1.211,28), permitirá criar 500 vídeos de até 20 segundos, com a possibilidade de fazer cinco pedidos de uma só vez.

O plano mais caro ainda permitirá retirar a marca d’água do vídeo. Até agora, a Sora estava disponível apenas para produtores de vídeos selecionados, por questões de segurança, de acordo com a desenvolvedora.

Desafios e Considerações Éticas

Contudo, apesar dos inúmeros benefícios, o uso do Sora OpenAI também levanta questões éticas importantes. Dessa forma, a privacidade dos dados dos usuários, a transparência nas interações e o potencial de uso indevido da tecnologia são áreas que requerem atenção cuidadosa. Além disso, também é fundamental levantarmos as questões de direitos autorais e sucateamento do trabalho artistico. Vamos ficar atentos!

Comentários

comments