quinta-feira, 20 de outubro de 2011

Apresentação Webmedia 2011 - Reversing Anaglyph Videos Into Stereo Pairs

Olá!

Durante os dias 3 a 6 de outubro desse ano ocorreu o 17° WebMedia em Floripa. O artigo, escrito por mim, um aluno de doutorado também da área, e meu orientador, foi aceito e eu apresentei no último dia.

Neste artigo, apresentamos nossa técnica para reversão de um vídeo anaglífico, obtendo novamente o par estéreo que o originou. Essa técnica se insere numa proposta mais ampla do nosso grupo, em busca de criar um codificador exclusivo para vídeos estereoscópicos, buscando qualidade acima de tudo, ou seja, codificar o vídeo com o mínimo possível de perda da percepção de profundidade - que é a graça dos vídeos 3D esteoscópicos :)

Segue abaixo o link para a apresentação do artigo, tanto em português-BR quanto em inglês. O artigo logo será publicado na Digital Library da ACM, sob o título de "Reversing Anaglyph Videos Into Stereo Pairs".

Como este artigo foi submetido na metade do ano, de lá pra cá nossa técnica evoluiu e novos resultados foram obtidos; estes foram submetidos ao ACM SAC de 2012 e, uma grande alegria para nós, foi aceito para publicação e apresentação! Este simpósio é internacional e será realizado na Itália. O título do artigo é "RevGlyph - A Technique for Reverting Anaglyph Stereoscopic Videos". Como a técnica foi apresentada no primeiro artigo, neste o foco são em melhorias feitas e análise aprofundada dos resultado, fora que a técnica ganhou um nome ;) 

Até mais!

Links

Reversing Anaglyph Videos Into Stereo Pairs
apresentação Português-BR | English presentation


terça-feira, 11 de outubro de 2011

Minicurso - Criação de Imagens e Vídeos 3D com OpenCV


Slide inicial da apresentação do minicurso
Slide inicial da apresentação do minicurso

Olá!

Dia 20 de setembro dei um minicurso durante a Semana de Computação - SemComp do Instituto aqui na universidade. O minicurso foi voltado à criação de imagens e vídeos 3D esterescópicos do tipo anaglífico, utilizando o OpenCV. Contou com a participação de cerca de 40 alunos, que puderam criar imagens e vídeos anáglifos vermelho-ciano, e levaram de presente o óculos necessário para a visualização.

Deixei compartilhado na minha página pessoal o material do minicurso, incluindo o PDF da apresentação, bem como os códigos e links úteis. Para aqueles que desejarem utilizar meu material para outros minicursos/apresentações, só peço para que referenciem a origem. Caso necessitem, posso passar o PPT da apresentação.

Até mais!

terça-feira, 16 de agosto de 2011

Apresentação de Introdução ao Vídeo 3D Estereoscópico

Oi pessoal, tudo bem?

Hoje vou deixar um arquivo com uma apresentação que eu e minha amiga Sandra fizemos para a disciplina de Multimídia aqui na pós-graduação. Preparamos um material introdutório sobre vídeo 3D estereoscópico, abordando todo processo de visualização 3D estereoscópica. Os slides possuem pouco texto, por isso também disponibilizo um documento com mais detalhes de cada tópico abordado na apresentação.

Download da apresentação

Download do documento

Caso alguém queira utilizar parte do material, fique à vontade desde que referencie de onde o retirou: no caso, foi daqui do blog. Se quiser a versão Power Point é só me enviar um email que eu a disponibilizo.


segunda-feira, 8 de agosto de 2011

Debate TV 3D: Tecnologia ativa x passiva

Olá pessoal! Passando para deixar algumas atualizações no blog. Não, ele não está extinto... ainda :-)

O pessoal da Revista Home Theater & Casa Digital promoveu um debate convidando a LG (representada pela Fernanda Suma – gerente de produto) e a Samsung (representada pelo Rafael Cintra – gerente de produto) para falarem sobre suas TVs 3D, as diferenças entre elas e tirar dúvidas dos ouvintes e internautas acerca da tecnologia 3D como um todo. Deixo aqui minha opinião sobre o debate.

Diferença nas tecnologias


A Samsung fez uma apresentação mais comercial, defendendo a tecnologia de óculos ativos, que eu classifico como óculos obturadores. Essa é a tecnologia dominante nos televisores 3D. Pretendo criar um post com mais detalhes sobre esta tecnologia. Bem resumido, o funcionamento é o seguinte: existem dois sinais de vídeos, um para cada olho, chamado de par estéreo. A TV alterna entre esses sinais de vídeo, enviando um frame de cada um, ou seja, um frame do vídeo esquerdo, outro do vídeo direito, e assim por diante. Essa alternância ocorre a uma frequência bem alta. Os óculos ativos são sincronizados com a TV através de Bluetooth, alternando a visão de cada lente de forma a acompanhar o frame sendo exibido pela TV. Em outras palavras, quando a TV envia um frame do vídeo esquerdo, os óculos ativam apenas a lente esquerda, deixando a lente direita ofuscada; o mesmo ocorre quando é enviado um frame do vídeo direito. Com isso, a tecnologia é parecida com um pisca-pisca, porém em alta frequência (cerca de 60 frames para cada olho por segundo). Com essa frequência, nossos olhos acabam não notando o ofuscamento causado pelos óculos. Eles defendem esta tecnologia pela qualidade das imagens, possibilitando reprodução Full HD, sem utilização de filtros, o que garante a reprodução fiel da mídia.

A LG apresenta e defende tecnologia de óculos passivos, que eles chamam de FPR, que eu classifico como óculos polarizadores. O funcionamento resumido é que os frames de ambos os vídeos são enviados simultaneamente, sendo separados pelos óculos (que funciona como um filtro, captando desse modo apenas o vídeo desejado). Segundo eles, essa nova tecnologia promove melhor conforto visual por não haver mais a alternância entre frames necessária na tecnologia ativa. Essa alternância, dependendo da frequência utilizada, provoca cintilação, ou flickering . O flickering é considerado como principal reclamação de quem tem seu primeiro contato com uma tela 3D, devido ao mal estar causado (pense em uma lâmpada no fim da vida, que começa a piscar sem parar e você entende o mal estar que alguns sentem). Há também conforto no uso, pois os óculos são mais leves, não precisam de bateria nem de sincronismo com o televisor. Por fim, o custo é reduzido (R$20,00 por óculos adicionais), um diferencial que muitos consumidores irão levar em conta na hora da compra.

Ambas apresentam televisores com garantia de reprodução 3D Full HD e possibilidade de conversão de conteúdo 2D para 3D, cuja qualidade não chega à de conteúdo criados exclusivamente em 3D.

Principais dúvidas do público


1-    Questão do peso e do preço dos óculos

A Samsung se compromete em proporcionar a melhor qualidade de imagem ao invés de redução de preços que poderiam influenciar em uma qualidade menor. Porém, estão sempre investindo em pesquisa para reduzir os preços, sempre garantindo melhor qualidade. Com relação ao peso, por necessitar de dispositivos físicos para o funcionamento do óculos (Bluetooth, infravermelho), o peso dos óculos da tecnologia ativa é maior. Outra característica a ser levado em conta na tecnologia ativa é a necessidade de se recarregar a bateria dos óculos, o que pode trazer incômodo se a bateria termina no meio de um filme, por exemplo.

2-    Questão da resolução Full HD na tecnologia passiva.

Não ficou muito claro para mim o esclarecimento da gerente de produto da LG. Pelo que eu entendi, a LG garante que entrega a imagem 3D em Full HD (1920x1080 linhas), através da combinação das duas imagens do par estéreo. Ou seja, cada imagem sozinha possui uma resolução menor, porém, quando em conjunto, a resolução das duas é somada para fornecer as 1080 linhas do Full HD. Em minha opinião, acho esse esclarecimento ou pouco fraco, pois para mim ambas as imagens deveriam ser de resolução Full HD, independente de serem exibidas separadas ou em conjunto, pois a perda de resolução (logo, de detalhes finos da cena) existe, sim.

3-    Questão do conteúdo

Resposta de ambos: falta conteúdo. Realmente, a tecnologia avança, porém não é visto um grande investimento das emissoras na produção de conteúdo 3D (no Brasil, muitas ainda estão se recuperando do investimento em tecnologia para transmissão digital), estando atualmente limitados a grandes obras cinematográficas. Ambas as empresas possuem um canal em suas SmartTV para que os consumidores possam assistir conteúdo em 3D como filmes, trailers. Não deram muito detalhes sobre quais filmes são disponíveis nem se são atualizados constantemente com novos conteúdos.

Considerações finais


Foi bom saber o interesse crescente do público sobre a tecnologia estereoscópica e melhor ainda saber da variedade de tecnologias que a indústria de televisão vem a oferecer, possibilitando maior experiência do público para a escolha daquela que melhor se encaixa a seus gostos com um melhor custo-benefício. Espero que novos debates possam surgir, envolvendo pessoal mais técnico e independente, que possam responder com mais propriedade e profundidade em questões mais específicas sobre 3D de forma imparcial.

Com relação ao desconforto e mal estar, vale lembrar que por ser uma tecnologia em amadurecimento, ainda falta muita pesquisa para corroborar cientificamente o mal estar apontado por muitos. Muitos fatores estão envolvidos, desde a utilização dos óculos, a própria produção do conteúdo 3D e até mesmo os fatores biológicos de cada pessoa (miopias, presbiopias e derivados). Mesmo assim, por precaução, cabe sempre o bom senso no uso: não assistir por um longo período de tempo, desativar o 3D caso esteja causando desconforto, não deixar crianças assistindo conteúdo 3D por um longo período de tempo.

Com relação a qual é melhor: tecnologia ativa ou passiva, minha preferência por enquanto é pela tecnologia ativa. Tive a oportunidade de testar um televisor 3D para o Teste USP da Folha de São Paulo e pude comprovar a qualidade Full HD e a ótima sensação de profundidade, embora seja real o desconforto dos óculos, que por sinal, são delicados e nem se parecem com óculos. Já o mal estar visual, eu não tive problemas. A tecnologia passiva é muito utilizada nos cinemas 3D e, por experiências passadas, eu não gostei muito. A sensação de profundidade é realmente boa, mas os vídeos parecem mais escurecidos quando utilizada esta tecnologia, devido à utilização de filtros polarizadores (sensação semelhante a quando utilizamos óculos de sol).

Referências:


Vídeos do Debate: parte 1 e parte 2. Já aviso que os 40 minutos finais começam a ficar um pouco mais comercial e fogem do assunto 3D.

Teste comparativo 3D ativo e passivo.

Tecnologia FPR.

terça-feira, 26 de abril de 2011

Parada do blog - Aulas e Qualificação

Oi!

Pouco tempo de vida do blog e eu já vou fazer uma pequena parada nas atualizações. Em março começaram as aulas do Mestrado, que são bem puxadas, fora a aproximação da Quali e também submissão de artigos para os eventos científicos.

Quando possível, irei atualizando o blog com algumas postagens que eu tenho armazenadas aguardando revisão.

Abraços,
Matheus

sexta-feira, 11 de março de 2011

Criação de imagem anaglífica

Este será um post mais técnico, que os computeiros irão adorar. Irei disponibilizar o código que desenvolvi em OpenCV para criação de uma imagem anaglífica (vermelho-ciano) a partir de um par estéreo de imagens. O OpenCV é uma ótima biblioteca escrita em C que possui várias funções otimizadas para visão computacional e processamento de imagens. Ele tem sido utilizado em diversos projetos, inclusive para hacking do Kinect. Mais para frente, farei um ou mais posts somente para detalhar a biblioteca e seu uso.

Sobre o código

A utilização do OpenCV deixa o código bem simples e facilita o trabalho com imagens. Há uma estrutura já pronta para imagens chamada de IplImage , na qual podemos definir vários parâmetros, tais como dimensões (altura e comprimento), espaço de cores (grayscale, RGB, YCbCr, etc.), densidade de bits para cada canal de cor (isto é, número de bits para armazenar os valores de cada canal de cor), dentre outros descritos na documentação.

O código lê dois argumentos da linha de comando (argv[1] e argv[2]) como sendo o caminho para as duas imagens do par estéreo, sendo argv[1] a imagem correspondente ao lado direito e argv[2] a imagem correspondente ao lado esquerdo. Logo após, faço um tratamento de erros bem simples, verificando se os arquivos puderam ser abertos e se as imagens possuem mesma dimensão. Uma ressalva para o carregamento das imagens: o OpenCv as carrega no formato RGB, porém, com ordem alterada dos canais, ficando de fato sendo BGR. Isto é importante na hora de percorrermos a matriz que representa a imagem.

Partimos então para dois loops for, percorrendo coluna a coluna e depois linha a linha. Para cada linha, utilizam-se dois ponteiros, um para cada imagem. Observem que o valor atribuído aos ponteiros é feito através de um cálculo mais complexo do que um row++. É um pouco difícil de explicar isso sem detalhar a estrutura do IplImage, então peço para que tenham fé :-) pois é desse jeito que tem que ser feito para se ter certeza de ter passado corretamente para a próxima linha.

A estrutura do IplImage armazena em apenas uma matriz os valores associados a cada canal, diferente de estruturas clássicas que criam uma matriz para cada canal. Sendo assim, a cada três colunas teremos as informações correspondentes a um pixel, ou seja, teremos sempre os valores dessa maneira: B1G1R1, B2G2R2, B3G3R3, e assim por diante. Tendo isso em vista, zeramos os valores dos canais azul e verde na imagem correspondente ao lado direito (primeira e segunda colunas de cada pixel) e zeramos também os valores do canal vermelho na imagem correspondente ao lado esquerdo (terceira coluna de cada pixel).

Feito isso, criamos uma nova estrutura IplImage para armazenar a junção do par estéreo, copiando as propriedades de dimensão, densidade de bits e número de canal de uma das imagens. Logo após, utilizamos a função cvAdd, cujos parâmetros são a imagem direita, esquerda e a nova, e por fim, salvamos a nova imagem, em formato BMP. Mantendo uma boa prática de programação, liberamos os ponteiros utilizados antes de sair do programa.

Captura das imagens

O ideal seria ter duas câmeras acopladas e calibradas para fazer a captura de uma cena. Como isso é caro e demanda tempo, usamos o "jeitinho brasileiro". O problema com isso é a imperfeição de não conseguir capturar duas imagens ao mesmo tempo, ou seja, o lugar e os elementos dos quais queremos tirar a foto devem ser estáticos. Outro problema é com relação à posição da câmera: ela deve deslocar-se apenas horizontalmente, mantendo a mesma altura e ângulo de visão. Além disso, temos que levar em conta a qualidade da imagem criada pela câmera e se internamente já não é feita alguma compressão, como por exemplo, conversão para JPEG, o que pode interferir na transformação. Isso torna a conversão para anaglífico um pouco difícil e de baixa qualidade, porém, com teimosia você obtém uma imagem com bom efeito.

Sugiro utilizar uma câmera com tripé em um piso plano. Faça uma linha reta no chão e marque as duas posições onde a câmera deve ficar na hora de bater a foto. Durante o deslocamento da câmera, tenha o máximo de cuidado para não movimentá-la no eixo vertical, alterando o ângulo de visão.

Outra solução para os preguiçosos é utilizar o Google e fazer uma busca de imagens por “estereo pair”.

Utilização do programa

Para usuários Windows: Abra uma janela de comando e vá até a pasta onde você descompactou o pacote RAR. Digite então o nome do programa, o caminho para a imagem da direita e o caminho para a imagem da esquerda e aperte ENTER. Uma dica é deixar as duas imagens na mesma pasta em que se encontra o programa, desse jeito, basta apenas digitar o nome das imagens. Veja a Figura 1 para ter um exemplo de execução.

Figura 1 - Exemplo de execução do código (clique para aumentar)


Para usuários Linux, sorry, mas eu não uso. Se você usa, tenho certeza que já tem conhecimento suficiente para usar os comandos de extrair e executar. Caso contrário, deixe um comentário e a gente sofre junto.

Seguem abaixo duas imagens que eu fiz com a minha câmera aqui em casa. Notem que sou pobre, e a qualidade da minha câmera é péssima. Mesmo assim, obtive imagens com efeito estereoscópico, porém de baixíssima qualidade, admito.





Para dúvidas no código ou execução, deixe um comentário.

Referência

Utilizo bastante o livro Learning OpenCV, escrito pelos próprios criadores da biblioteca.

Download do código

Faça o dowload clicando aqui.

sexta-feira, 4 de março de 2011

Informações de Profundidade - Disparidade e Paralaxe

Duas informações importantíssimas para a percepção e reprodução de vídeos estereoscópicos, muito exploradas para passar a sensação de profundidade. O conceito de ambas é semelhante, sendo diferenciadas pelo meio em que ocorrem.

Vamos falar primeiro da disparidade. Como já mencionado no primeiro post desse blog, possuímos visão binocular, o que faz com que cada um de nossos olhos enxerguem a mesma imagem sob uma perspectiva diferente, devido ao fato de eles estarem cerca de 6,5cm distantes horizontalmente. Com isso, ao olharmos uma paisagem, por exemplo, os diversos elementos presentes na cena ocupam posições muitas vezes diferentes em cada retina. A distância entre as posições de um elemento em cada retina é chamada de disparidade. Podemos enganar os nossos olhos com um simples exemplo para observar a disparidade. Observe a imagem abaixo.

Imagem para exemplificar o conceito de disparidade
Posicione seu polegar entre você e a imagem, de forma que ela ainda continue sendo vista por você.  Agora foque sua atenção no polegar, isto é, concentre seus olhos nele. Você percebe que a imagem começa a ficar como que duplicada. E esse efeito aumenta se você aproximar ainda mais seu polegar para perto de você. A disparidade é a distância entre essas duplicatas. Obtemos o mesmo efeito fazendo o reverso: focalizando o olhar na imagem e vendo o polegar sendo duplicado.

A paralaxe segue o mesmo conceito de distância, mas agora ao invés de ser observado no olho, a paralaxe ocorre em dispositivos de reprodução, como telas ou monitores. Para vídeos estereoscópicos, uma das formas de captura é utilizando um dispositivo especial que possui duas câmeras acopladas horizontalmente e calibradas para fazer a captura de maneira simultânea, simulando a nossa visão. Com isso, é gerado um par de vídeos, denominado par estéreo. Ao sobrepormos estes vídeos, podemos notar o deslocamentos de alguns elementos. A distância de tal deslocamento é a paralaxe.

Pode-se dividir a paralaxe em quatro tipos, sendo que para cada um obtemos um efeito diferente na visualização estereoscópica.

  • Paralalaxe Zero: quando a distância entre os pontos correspondentes em uma imagem é zero. Isso significa que o foco das câmeras estava nesse ponto (do mesmo jeito quando focamos no polegar).
  • Paralaxe Positiva: A distância entre os pontos está entre 0 e uma constante t, dando a sensação de que os objetos estão distantes.
  • Paralaxe Negativa: o inverso da positiva, a distância entre os pontos gera um valor negativo. É com ela que temos a sensação de objetos “saltando” da tela.
  • Paralaxe Divergente: é quando a distância entre os pontos ultrapassa a constante t, causando um efeito que não é similar a nenhum outro na visão humana, e com isso, causando desconforto na visualização.

That's all, folks! Fim de semana com o feriadão de Carnaval chegando. Vou aproveitar bastante.... jogando Playstation 3 :-) Até mais!

Referências:


StereoGraphics Developers' Handbook – Stereographics Corporation. Escrito em inglês, pode ser utilizado como introdução para estereoscopia, explica as variadas informações de profundidade, bem como formatos de reprodução.

Imagem do cisne negro

terça-feira, 22 de fevereiro de 2011

Visualização estereoscópica – Estereoscopia Anaglífica

Este é o método mais antigo e mais simples para se implementar e ver imagens e vídeos estereoscópicos. Ele consiste em termos duas imagens RGB, sendo que elas são da mesma cena, distanciadas na horizontal aproximadamente 6,5cm uma da outra. Com isso, estamos simulando a visão humana, já que cada olho está aproximadamente 6,5 cm de distância e por isso têm pontos de vista diferente daquilo que enxergamos.

O método consiste de 3 passos: Com a imagem destinada ao olho esquerdo, retiramos seu canal de cor vermelho (Figura 1). Já com a imagem destinada ao olho direito, retiramos os canais verde e azul (Figura 2). Logo após, uma imagem é sobreposta à outra, e temos nossa imagem anaglífica (Figura 3)! Agora utilizando óculos apropriados, você consegue perceber que o leão parece estar bem à frente da construção.

Figura 1 - Imagem esquerda sem o canal de cor vermelho
Figura 2 - Imagem direita sem os canais de cor azul e verde
Figura 3 - Imagem anaglífica
  
Observe que o método descrito acima é o utilizado para visualização anaglífica com o óculos vermelho-ciano (Figura 4). Para outros tipos, como verde-magenta, o método é similar, mudando apenas o canal de cor que vai ser extraído de cada imagem. Outro ponto de atenção é em relação à ordem das cores no óculos: para óculos vermelho-ciano, a cor vermelha fica na lente esquerda e a ciano fica na lente direita. Em outro post há um vídeo explicando como fazer um óculos desse tipo.

Figura 4 - Óculos vermelho-ciano

Explicação

O óculos utilizado atua como um filtro. As lentes de cores diferentes irão “separar” as imagens novamente, baseados na cor que elas possuem, ou seja, a lente vermelha vai separar a imagem que possui apenas o canal vermelho e a lente ciano vai separar a imagem que possui apenas os canais verde e azuis. Com isso, seu olho esquerdo irá enxergar apenas a imagem vermelha e seu olho direito, apenas a imagem ciano, cabendo ao seu cérebro fazer a junção das duas e extrair as informações de profundidade.

Faça um teste: coloque o óculos vermelho-ciano. Feche o olho direito e olhe para a Figura 2, você irá enxergar a figura com vários pontos em vermelho. Agora faça o contrário, fechando o olho esquerdo e abrindo o direito e olhando novamente para a Figura 2. Você vai enxergar apenas preto, já que esta lente não filtra cor vermelha. Legal, não é?

Desvantagem

A  principal  desvantagem  é  que estamos tirando as cores reais de cada imagem, ou seja, perdemos informações. Com isso, a imagem resultante que nosso cérebro irá interpretar não possui as cores reais da imagem original.

Em futuros posts irei fazer um tutorial de como criar imagens anaglífica utilizando o Photoshop e um programa que eu criei. Aguardem!

Créditos das fotos

Leão
Óculos vermelho-ciano

terça-feira, 15 de fevereiro de 2011

Veja vídeos em 3D no Youtube!

Não sei desde quando isso está no ar, mas só hoje que eu tomei conhecimento do Youtube 3D Gallery, um canal que reúne várias listas de reprodução de vídeos 3D utilizando a tecnologia de conversão disponibilizada pelo Youtube. É muito legal e em alguns vídeos dá para ser tem uma experiência bem bacana.

Para assistir aos vídeos, é necessário utilizar óculos especiais de visão anaglífica, conhecido como óculos vermelho/ciano. Existe até um vídeo (abaixo) linkado no próprio canal que ensina como fazer um óculos desse utilizando a tampa de um case de CD e caneta vermelha e azul (ciano é a combinação de azul e verde resultando em uma cor comumente chamada de azul-piscina ou verde água).



Experimente também assistir aos vídeos com um olho fechado para sentir a diferença.

A qualidade da cor dos vídeos é baixa e irei explicar com mais detalhes do porquê em um post sobre visão anaglífica. Aguardem! :-)

Segue abaixo alguns dos vídeos que eu gostei. Há nas opções do player a possibilidade de ver o vídeo em 2D.

Este foi o que eu achei mais legal, vale muito a pena! Da pra ter direitinho a sensação de insetos e folhas saindo da tela!



domingo, 13 de fevereiro de 2011

O Castelo da Cinderela – Walt Disney World

Post rápido com uma demonstração de uso da perspectiva, neste caso denominada de perspectiva forçada (forced perspective).

Conheci essa curiosidade sobre o castelo da Cinderela assistindo a um dos videocasts da família Jovem Nerd durante as férias na Disney (vídeo nas referências).

Como se sabe, a Disney foi criada para ser um lugar em que as famílias podiam ir para se esquecer do mundo e se divertir. E isso é levado a sério! Os cenários e brinquedos são todos decorados de uma forma que a pessoa não veja nenhuma parte mecanizada que tire a beleza e a magia. E eles fazem esse “mascaramento” muitas vezes de maneiras criativas, como veremos abaixo.

O Castelo da Cinderela pode ser considerado o maior símbolo da Disney, presente na abertura de todas as produções cinematográficas da companhia. Ele se situa bem no centro de Magic Kingdom, tornando-se ponto de destaque por sua beleza e "altura".

Porém, é na parte da altura que muitos se enganam. Existe uma lei americana que diz que a partir de certa altura, uma construção obrigatoriamente deve possuir uma antena com uma luz em sua ponta piscando, como sinal para aeronaves que estejam voando a baixa altitude. Uma antena piscante dessas acabaria com a magia do castelo, e por isso ele foi construído abaixo do limite, possuindo cerca de 58 metros de altura. Mesmo assim, todos os felizardos que têm a oportunidade de ir, acabam achando que o castelo é muito maior. E aí entra a parte criativa da história, com a utilização da perspectiva forçada.

O que ocorre é um truque óptico: as partes mais altas do castelo têm suas proporções menores do que as partes mais baixas. Isto quer dizer que, à medida que vamos “subindo” no castelo, as torres, janelas, tijolos, tudo vai diminuindo de proporção, causando a quem olha de longe ver o castelo mais alto do que realmente é (lembra-se que através da perspectiva o nosso cérebro interpreta que objetos menores estão mais distantes?).

Porém, vou fingir que sou cético quanto a isso. Só acredito vendo. Alguém interessado em patrocinar uma viagem aí? :-)

Outro exemplo de perspectiva forçada. Como a garota ao fundo está distante, parece que está menor. Como a mão está bem próxima da câmera e abaixo dos pés da garota, temos a impressão de ela ser realmente pequena e caber na palma da mão da outra.

Referências:

The Disney Wiki, de onde tirei praticamente tudo
http://disney.wikia.com/wiki/Cinderella%27s_Castle

Youtube do Jovem Nerd (procurem por NERDTOUR para ver vídeos da Disney)
http://www.youtube.com/user/JovemNerd

Vários exemplos de perspectiva forçada. Vale a pena!
http://www.instantshift.com/2010/08/24/88-brilliant-examples-of-forced-perspective-photography/

Créditos das fotos:
Castelo da Cinderela
Pessoa na mão

quarta-feira, 9 de fevereiro de 2011

Informações de Profundidade – Perspectiva

Irei fazer uma série de posts relacionados às chamadas “Informações de Profundidade”, que em inglês são encontradas como “Depth Cues”. Elas representam alguns dos fatores relacionados ao processo de transformação tridimensional de uma imagem pelo cérebro, sendo que tal processo não é totalmente conhecido. Como veremos neste e em demais posts, o cérebro utiliza dessas informações para interpretar se um objeto está próximo ou longe, se é grande ou pequeno, se possui uma textura delicada, se é sólido, qual o seu formato, etc..

A primeira dessas informações é a perspectiva, provavelmente uma das mais conhecidas, já que também é uma técnica muito utilizada por artistas, arquitetos e engenheiros. Ela é definida como uma forma de projeção de um objeto tridimensional em uma superfície bidimensional. Um exemplo simples é quando você aprende na escola a desenhar um cubo, ou dado, utilizando dois quadrados e ligando seus vértices através de arestas (e tendo a famosa briga sobre qual face está na frente e qual está atrás). Com isso, temos a utilização de quadriláteros - objetos bidimensionais - e linhas para representar um cubo - objeto tridimensional.

Podemos ver o uso da perspectiva em várias obras renascentistas, já que esta era muito utilizada pelos artistas para a representação da realidade de maneira mais fiel. Aliás, foi na época do Renascimento que esta técnica foi profundamente estudada e sistematizada na Matemática, fazendo parte da Geometria Descritiva.

Existem várias classificações para a perspectiva atribuídas pela Geometria Descritiva (que podem ser vistas nas referências). Para o que interessa neste blog, vou ficar com a divisão da perspectiva em duas: a linear e a aérea.

A perspectiva linear é uma das principais técnicas para prover informação de profundidade em uma imagem. Com o seu uso, temos a sensação de posicionamento e escala, descrevendo se objetos estão distantes ou próximos, de acordo com o seu tamanho e posição na imagem e do uso de linhas de referência. Ela pode até passar uma sensação de movimento mesmo em uma imagem estática, como, por exemplo, a representação de uma estrada através de duas linhas retas se convergindo no horizonte.


A perspectiva é usada pelos arquitetos para dar noção de espaço e profundidade entre os objetos de uma cozinha, por exemplo.

Observe que a estrada e os carros vão diminuindo à medida que as linhas vão convergindo no horizonte, dando a sensação de distância e "movimento"

A perspectiva aérea também nos dá informação de distância entre objetos através da visibilidade que temos deles. No dia a dia, podemos notar que perdemos a visibilidade de objetos que se encontram muito distantes, geralmente por causa de neblinas, chuvas ou outro fenômeno atmosférico. Outras vezes, tais objetos podem nem estar tão distantes assim, porém, a falta de visibilidade nos faz sentir que estão. Um exemplo simples é ao olhar para uma foto de um espaço aberto com algumas montanhas. À medida que elas ficam distantes, fica mais difícil de enxergá-las, como se estivessem cobertas por uma neblina.

Observe como as montanhas ao fundo são difíceis de enxergar, nos passando a sensação de que estão realmente distantes

Em futuras postagens, falarei sobre outras informações de profundidade como: paralaxe, interposição, estereopsia, disparidade, e mais algumas. Para os curiosos, deem uma olhada nas referências. ;-)

Referências

Minioficina de introdução de perspectiva e conceitos atrelados
http://www.abra.com.br/oficinas/12-como-entender-a-perspectiva

Aula de Geometria Descritiva explicando a perspectiva e suas várias classificações
http://www.mat.uel.br/geometrica/php/gd_t/gd_2t.php

Livro sobre computação gráfica com uma seção falando sobre algumas informações de profundidade
Azevedo, E.; Conci, A. – Computação gráfica: teoria e prática. Editora Campus, Elsevier, 2003. pags. 10-14

Créditos das fotos

Filme 3D – Desambiguação

Para começar este blog, vou explorar o tema “filme 3D”, que nos últimos anos voltou em cena, devido principalmente à tecnologia utilizada em Avatar, e cujo termo é muitas vezes utilizado para tratar de tópicos diferentes. Quais seriam estes tópicos?

Irei dividir os filmes 3D em duas categorias e justificar o porquê de serem diferentes: filmes tridimensionais e filmes estereoscópicos.

Filmes tridimensionais

Em 1995, Toy Story entrou para a história do cinema, trazendo aos telões o primeiro filme totalmente animado por computação gráfica. Diante do grande sucesso desta produção produzida pela Disney/Pixar, logo vieram novas franquias, como Monstros S/A, Carros, Shrek, dentre outros, cada qual trazendo gráficos mais definidos e técnicas superiores. Por volta desta mesma época, o videogame Nintendo 64 começou a ser vendido, trazendo consigo o jogo Super Mario 64, marcando o início das dores de cabeça para programadores de jogos da popularização de jogos tridimensionais.

O desenvolvimento de filmes e jogos desse tipo baseia-se em modelagem e criação de cenários e personagens em três dimensões, isto é, sua representação geométrica é feita utilizando os eixos x, y e z do sistema de coordenadas cartesianas para representar as dimensões de largura, altura e profundidade. Utilizando de técnicas de iluminação e perspectiva, as animações tridimensionais passam uma sensação mais realista daquilo que estamos vendo na tela. Entretanto, nossos olhos continuam enxergando somente as duas dimensões que os televisores comuns são capazes de reproduzir.

Vídeo mostrando cenas da modelagem de cenários e personagens do filme Shrek Pra Sempre

Filmes estereoscópicos

A tecnologia por trás do filme Avatar é avançada e demorou cerca de 14 anos para amadurecer o suficiente para o filme ser produzido com a qualidade e os efeitos desejados. Da mesma forma com que filmes e jogos derivaram de Toy Story e Super Mario 64, Avatar marcou o início da produção de filmes em 3D utilizando a tecnologia desenvolvida. Mesmo assim, diferente do que vimos na seção anterior, neste caso os elementos presentes nas cenas pareciam muitas vezes saltar da tela ou estar bem distantes. Isso foi possível devido ao uso de uma técnica nem um pouco recente: a estereoscopia.

A estereoscopia baseia-se em métodos que utilizam um par de imagens planas para a formação de uma imagem tridimensional. Isto é possível devido à nossa visão binocular, isto é, cada um de nossos olhos enxerga a mesma imagem só que com pontos de vista diferentes. Cabe ao cérebro receber esse par de imagens e gerar somente uma, com informações de profundidade que nos possibilitam perceber que objetos estão mais próximos e que objetos estão mais distantes.

A tecnologia utilizada no filme de Avatar faz exatamente isso: as cenas são filmadas utilizando duas câmeras para captar pontos de vista diferentes, simulando a visão humana, e então são reproduzidas através de aparelhos especiais que fazem com que cada olho veja somente a imagem que lhe pertence. O cérebro interpreta o par de imagens e temos a sensação de profundidade na cena.

Desambiguação

Como podemos ver, as técnicas utilizadas para filmes tridimensionais e estereoscópicos são distintas e mesmo assim muitas vezes ouvimos e lemos ambos serem tratados genericamente como vídeos ou jogos 3D. Acontece que o termo recebeu um significado diferente como o passar do tempo, baseado naquilo que está "na moda". Portanto, dizer que um filme ou jogo é 3D nos dias atuais vai fazer com que a maioria das pessoas, principalmente as mais novas, pense que você está se referindo às animações que, através de óculos especiais ou não, parecem que estão saindo da tela e vindo em sua direção. Vale a pena lembrar também que estas duas categorias podem aparecer juntas, como pode ser visto em recentes produções como Shrek Pra Sempre e Toy Story 3.

Observe que esta é apenas a minha opinião. Em outros blogs, sites e revistas, ou até mesmo livros, podem aparecer outras definições ou classificações. Até mesmo neste blog irei utilizar o termo “vídeo 3D” na maioria das vezes para tratar de vídeos estereoscópicos. Considero que esta separação é útil para categorizar os vídeos de acordo com a tecnologia e técnicas utilizadas, de modo a facilitar os estudos e pesquisas acerca deste tema. E você, o que acha? Por favor, deixe seu comentário dando sua opinião em relação a isso.

Referências e links úteis:

Curta introdução sobre os diferentes métodos de reprodução de vídeos 3D
Artigo sobre a produção do filme Avatar
Pixar - Linha do tempo
Dreamworks – Lista de produções