Visualizar a Vertov

Por Lev Manovich

Biografía + Observaciones +
El doctor Lev Manovich es artista, teórico y crítico especialista en nuevos medios. Es pionero en la aplicación de análisis de datos científicos en el análisis de la cultura contemporánea. Manovich es autor y editor de más de diez libros entre los que se incluyen Cultural Analytics (en prensa, 2017), Instagram and Contemporary Image, Data Drift, Software Takes Command, Soft Cinema: Navigating the Database and The Language of New Media. Actualmente es Profesor de ciencia computacional en Graduate Center, CUNY y Director de Cultural Analytics Lab. Al español se encuentra traducido su libro "El lenguaje de los nuevos medios de comunicación. La imagen en la era digital" (Paidós, 2005). Para más información revisar su website http://manovich.net
Traducción: Agustín Berti. Doctor en Letras de la Universidad Nacional de Córdoba. Investiga los cambios ocurridos por la digitalización en la literatura, el cine y las artes audiovisuales. Es autor de Agrippa and other Hybrids at the Origins of Digital Culture (2015). Es investigador asistente del CONICET, docente de la Maestría en Técnica, Políticas y Culturas de la Universidad Nacional de Córdoba y profesor titular de “Análisis y Crítica” en el Departamento de Cine y TV de la Facultad de Artes de la misma casa de altos estudios. Es miembro de Dédalus, grupo de investigación sobre la técnica.   Versión del artículo en ingles puede verse aquí: http://manovich.net/index.php/projects/visualizing-vertov Versiones en alta resolución de todas las visualizaciones que aparecen en este texto están disponibles en Flickr para descargar: http://www.flickr.com/photos/culturevis/sets/72157632441192048/with/8349174610/
 

 “Para representar un estudio dinámico en una hoja de papel, necesitamos símbolos gráficos del movimiento”.

Dziga Vertov, “We: The variant of the manifesto” (1920), de Kino-Eye: the writings of Dziga Vertov, ed. Annette Michelson, trad. Kevin O’Brien (University of California Press, 1984), p. 7.

 

Este proyecto presenta análisis de visualización de las películas El undécimo año (1928) y El hombre de la cámara (1929) por el famoso cineasta ruso Dziga Vertov. Utiliza técnicas de visualización experimental 1 Para el análisis detallado de nuestras técnicas de visualización utilizadas en este proyecto, véase Lev Manovich, “Visualización de los medios: Visual Techniques for Exploring Large Media Collections”, Media Studies Futures, ed. Kelly Gates (Blackwell, 2012), http://softwarestudies.com/cultural_analytics/Manovich.Media_Visualization.web.2012.v2.doc Estas técnicas se nutren de los proyectos anteriores de artistas digitales y diseñadores discutidas en Lev Manovich, “What is Visualization?”, Visual studies (Routledge, 2011), http://lab.softwarestudies.com/2010/10/new-article-is-visualization.html. que complementan las familiares barras de tablas y gráficos de línea que a menudo se encuentran en los estudios cuantitativos de artefactos culturales. Las copias digitales de las películas fueron proporcionados por el Museo Austríaco del Cine (Viena).

La visualización nos brinda nuevas maneras de estudiar y enseñar el cine, así como otros medios visuales basado en el tiempo tales como la televisión, el vídeo generado por usuarios, las animaciones y los juegos de computadora. El proyecto es parte de un programa de investigación más amplio para desarrollar técnicas para la exploración enormes colecciones de vídeos e imágenes que he estado dirigiendo en el Software Studies Initiative (softwarestudies.com) desde el 2007 2 Ver http://lab.softwarestudies.com/p/research_14.html . En este proyecto, exploro cómo las técnicas de “visualización de los medios”  que nosotros desarrollamos pueden ayudarnos a ver las películas de nuevas formas, complementando los métodos y herramientas ya bien desarrollados en los estudios sobre cine y medios. Otro objetivo del proyecto es establecer un puente entre dos campos que actualmente no están conectados: el campo de las humanidades digitales que está interesado en nuevas técnicas de visualización de datos, pero que no estudia cine y la investigación cuantitativa sobre cine que hasta ahora ha utilizado gráficos de manera más limitada.

El uso de visualizaciones para el estudio y diseño de medios se remonta a la labor de muchos cineastas, arquitectos, compositores, coreógrafos y artistas visuales modernos que crearon diagramas de sus proyectos antes o después de que fueran concretados. Vertov, en particular, creó muchos diagramas para resolver la producción, estructuras de contenido y edición en sus películas. Sergei Eisenstein diagramó una secuencia corta de Alexander Nevsky (1938) después de que la película ya había sido hecha. El coreógrafo y teórico Rudolf Laban diseñó un lenguaje de diagramas para la descripción y análisis de la danza que más tarde fue ampliamente utilizado por otros coreógrafos. El cineasta experimental austríaco Peter Kubelka exhibió su película Arnulf Rainer de 1960 que consistía solamente en cuadros blancos y negros puros como una instalación de pared, convirtiendo así una película en su propia visualización. 3Ver: http://lab.softwarestudies.com/2012/11/peter-kubelkas-arnulf-rainer-film-as.html Numerosos artistas elaboraron composiciones, paletas de colores y otros aspectos de sus pinturas en diagramas antes de llevar a cabo las pinturas reales.

0.1. Sergei Eisenstein. Diagrama de montaje de una secuencia de su película Alexander Nevsky (1938).

0.2. Peter Kubelka ante una instalación en pared de Arnulf Rainer (1960)

La televisión y el cine comercial del siglo XX dependían de storyboards, los diagramas dibujados a mano que guiaban la producción. Más recientemente, muchos largometrajes comenzaron a resolverse completamente en la preproducción usando modelos de animación 3D (este método se denomina previs). 

Otros precursores importantes del uso de la visualización para el análisis de los medios de comunicación se pueden encontrar en siglo XIX. El desarrollo de las tecnologías de registro de la fotografía y el cine motivó el trabajo sobre las técnicas para la diagramación automática del mundo visible y en particular del movimiento. (Esto es particularmente relevante para la visualización de las películas de Vertov ya que, como explicaré más adelante, al principio de su carrera, identificó la estética del cine con el movimiento de objetos y personas en el espacio). En la década de 1880, Étienne-Jules Marey calculó cómo utilizar la fotografía para diagramar el movimiento de los seres humanos y los animales en dos dimensiones. (Anteriormente, a partir de la década de 1860, había desarrollado muchos instrumentos para registrar gráficamente latidos del corazón, la respiración, los movimientos de los músculos y otras funciones fisiológicas). En los años 1910-1920 Frank y Lillian Gilbreth introdujeron nuevos métodos para registrar y estudiar los movimientos de los trabajadores mediante la fotografía y el cine. 

0.3. Ejemplo de estudios de movimiento de los Gilbreth usando su dispositivo cronociclográfico.

En la década de 1990, las producciones de películas y videojuegos adoptaron la captura de movimiento para registrar cuerpos en movimiento como diagramas 3D que luego se utilizaban para animar personajes generados por computadora. La captura de movimiento también es generalmente utilizada para registrar los movimientos faciales de los actores y dirigir caras animadas (por ejemplo, en Avatar de Cameron).

0.4. Caza de fantasmas, una instalación de arte digital de Paul Kaiser y Shelley Eshkar utiliza la captura de movimiento de las presentaciones de danza de Bill T. Jones.

El análisis computacional de las películas combinado con la visualización pueden permitirnos hacer “ingeniería reversa” con algunos aspectos del cine y de otros tipos de medios basados en el tiempo, revelando patrones interesantes a cualquier escala –desde una toma única a miles de millones de videos de YouTube. Como todos los métodos computacionales, estos tienen sus fortalezas y debilidades. Una computadora no tiene las mismas percepciones sobre el significado y la estructura de una película que su director y su editor. Sin embargo, puede ayudarnos a notar sutiles patrones en la edición, composición, movimiento y otros aspectos de la cinematografía y la narrativa que pueden ser difíciles de ver de otro modo. Las computadoras también nos pueden permitir comparar una cantidad de películas, ayudándonos a comprender lo que es típico y lo que es único en el conjunto de datos dado e identificar características comunes y patrones similares. En definitiva, si bien no pueden producir los diagramas analíticos tales como el creado por Sergei Eisenstein (ilustración superior), pueden hacer otras cosas que le resultarían muy difíciles o le insumirían mucho tiempo a un observador humano.

Uno de los conceptos claves de Vertov fue Kino-Ojo (Kino-Glaz en ruso), que recibió su mejor realización en El hombre de la cámara realizado en 1929 (muchos otros proyectos de película igualmente radicales de Vertov nunca fueron llevados a cabo). En un artículo de 1924 titulado, “El nacimiento del Kino-ojo”, él escribe:

 

Kino-ojo se entiende como ‘eso que el ojo no ve’,

como el microscopio y el telescopio del tiempo,

como el negativo del tiempo,

como la posibilidad de ver sin límites ni distancias,

como el control remoto de cámaras de cine,

como tele-ojo,

como rayos x,

como ‘vida atrapada por sorpresa’, etc., etc.

Kino-ojo como la posibilidad de hacer visible lo invisible. 4 Dziga Vertov, “The Birth of Kino-Eye” (1924), in Kino-Eye: the writings of Dziga Vertov, ed. Annette Michelson, trad. Kevin O’Brien (University of California Press, 1984), p. 7. 41

 

Hoy en día, los diseñadores de visualización de datos a menudo utilizan la misma frase, “hacer visible lo invisible”, para describir cómo la visualización puede revelar patrones en los datos. Para Vertov, este objetivo demandaba nuevas técnicas cinematográficas, montajísticas y logísticas. Las visualizaciones presentadas en este proyecto pretenden invertir el kino-ojo, apuntándolo hacia las películas de Vertov.

El gran cuerpo de investigación en estudios empíricos del cine ya ha explorado en detalle una dimensión cuantitativa de las películas –la duración de las tomas 5Esta investigación comenzó con Barry Salt, “The Statistical Style Analysis of Motion Pictures”, Film Quarterly, 28, 1 (1974), pp. 13-22. Para trabajos actuales, ver los artículos en http://www.cinemetrics.lv/articles.php; Yuri Tsivian, “What is cinema? An Agnostic Answer,” Critical Inquiry 34 (Summer 2008), pp. 754-776. Salt propone que los análisis de películas deben considerar un número de características como la escala de la toma, movimiento de la cámara y el ángulo de toma. Sin embargo, como él y otros investigadores ingresaban estos datos a mano, esto limitaba el número de films que podían ser anotados. Más recientemente, James E. Cutting en la Universidad de Cornell comenzó una nueva serie de estudios cuantitativos que utilizan métodos automáticos para medir otras propiedades además de las estadísticas de las tomas. Ver James Cutting, Jordan DeLong, and Christine Nothelfer, “Attention and Hollywood Films”, Psychological Science vol. 21, no. 3 (marzo de 2010), pp. 432-439; Cutting, Brunick, DeLong, Iricinschi, and Candan, “Quicker, faster, darker: Changes in Hollywood film over 75 years”, i-Perception (2011) vol. 2, pp. 569-576, http://people.psych.cornell.edu/~jec7/pubs/iperception.pdf. Un proyecto pionero del diseñador Frederic Brodbeck (2011) muestra cómo diversas dimensiones de las películas pueden ser visualizadas de manera creativa: http://cinemetrics.fredericbrodbeck.de/ . Se trata de una dimensión fácil de cuantificar: uno sólo debe contar el número de fotogramas entre los límites de la toma. El análisis de los patrones de duración de una toma también tiene sentido porque Vertov y muchos otros cineastas del siglo XX crearon tablas y diagramas para planificar las duraciones exactas de las tomas en las secuencias de sus películas.6 Yuri Tsivian hace referencia a ejemplos de estos diagramas y tablas en su introducción al sitio cinemetrics, http://www.cinemetrics.lv/ Barry Salt, Yuri Tsivian y otros académicos han demostrado que trabajando con datos de la duración de las tomas se pueden alcanzar un conocimiento nuevo e importante en el caso de películas particulares, obras de un único director, y, también, de períodos enteros de la historia del cine.

Uno de los objetivos de mi proyecto es mostrar cómo otras dimensiones de las películas también pueden ser exploradas mediante las técnicas de visualización particular. En algunos casos, utilizamos software de procesamiento de imágenes digitales para medir las propiedades visuales de cada fotograma tales como valor promedio de escala de grises, contraste, número de formas, número de aristas, las proporciones relativas de diferentes colores, propiedades de textura y así sucesivamente. (Comenzamos esta investigación en 2008; nuestro enfoque es similar al del psicólogo James Cutting y sus colegas, pero exploramos una serie de características de la imagen usando técnicas de visión computacional.) En otros casos, no medimos o contamos nada. En cambio, organizamos los fotogramas muestreados de una película en una única disposición de visualización en alta resolución. Este uso de la visualización sin mediciones, conteos o anotaciones agregadas es el aspecto crucial del acercamiento de mi laboratorio para trabajar con conjuntos de datos de medios, y espero que puedan incorporarse a otros métodos que ya se utilizan en estudios cuantitativos y en humanidades digitales.

La cartera de visualizaciones con comentarios a continuación comienza con tres visualizaciones que trazan la medición cuantitativa ya familiar de los films, duración de las tomas (1-3). Luego avanza para ilustrar otras estrategias posibles (4-9) utilizando el enfoque de “visualización de los medios”. Para crear visualizaciones de los medios, el software organiza los fotogramas muestreados de una película en diferentes disposiciones utilizando metadatos existentes (es decir, números de fotograma, límites de la toma, anotaciones manuales de contenido de  la toma, etc.) y/o mediciones creadas automáticamente de propiedades visuales de imágenes, fotos y películas enteras. No incluyo ninguna medición numérica de las películas en mi análisis principal, para hacer hincapié en que las técnicas de visualización pueden ayudarnos a explorar películas e identificar patrones más allá de la mera estadística 7El trabajo de mi laboratorio hace hincapié en lo que llamamos “visualización exploratoria” para trabajar con grandes conjuntos de datos de medios visuales. Adoptamos este término desde el enfoque del “análisis exploratorio de datos” en estadística. Para la discusión de análisis exploratorio de datos como método de estudios sobre cine, vea Nick Redfern, “Exploratory data analysis and film form: slasher films,” http://nickredfern.files.wordpress.com/2012/05/nick-redfern-the-editing-structure-of-slasher-films.pdf, 2012. (Se hace referencia a algunas de las mediciones en la sección “Detalles”).

Las visualizaciones están organizadas en una secuencia que comienza con un “ojo de pájaro” sobre los artefactos culturales (cientos de películas del siglo XX) y gradualmente se mueve cada más cerca, de modo similar a cómo Google Earth permite comenzar con la vista del planeta Tierra y luego hacer zoom in hasta eventualmente llegar a una vista a la calle. (Estoy pensando también en Powers of Ten de Ray y Charles Eames). Comenzamos con un paisaje de mil películas del siglo XX donde las de Vertov aparecen sólo como puntos (1). Luego hacemos zoom en estas películas, con cada toma representada como una barra en un gráfico de barras (2-3). En el siguiente “nivel de zoom”, empezamos a ver imágenes (un cuadro que representa a cada toma  –visualizaciones 4-7). Finalmente, nos acercamos a una única toma para ver más detalles (8-9). Para mí, una aplicación interactiva ideal para explorar cualquier zona de la cultura visual se organizaría de manera similar, con las visualizaciones mostrando distintos niveles de detalles y diferentes aspectos de los artefactos generados en tiempo real a medida que el usuario hace zoom hacia dentro o hacia afuera de un conjunto de datos. 8 Realizamos el prototipo dicha interfaz en 2008: http://lab.softwarestudies.com/2008/12/cultural-analytics-hiperspaceand.html.

La presentación es un experimento. Normalmente un artículo académico consta de texto con un pequeño número de ilustraciones. Por el contrario, esta es una cartera de un gran número de visualizaciones, con el texto como comentario. La presentación tampoco adelanta un argumento o un concepto. En cambio, progresivamente hago “zoom in” en el cine, explorando alternativas para visualizar los medios en niveles diferentes de zoom y tomo nota de observaciones y descubrimientos interesantes. Podemos comparar el género al de la escritura de viajes, donde el principio organizador es movimiento del escritor a través del espacio.

Con la excepción de las visualizaciones 1.1-1.3, que se han hecho en Excel, escribí el código para crear todas las demás. El código se implementó como macros que se ejecutaron dentro de ImageJ, una popular plataforma de procesamiento de imágenes de código abierto utilizada en las ciencias de la vida, la astronomía, la geografía y otros campos científicos 9 http://rsbweb.nih.gov/ij/ . En mi laboratorio también hemos desarrollado unos pocos macros totalmente documentados con interfaces gráficas de usuario; están disponibles para su descarga junto con la documentación que escribí sobre cómo utilizarlos para visualizar colecciones de vídeo e imagen. 10Ver: http://lab.softwarestudies.com/p/software-for-digital-humanities.html .

Agradezco a Adelheid Heftberger, investigadora de cine y miembro del personal del Museo Austríaco del Cine, por iniciar y hacer posible este proyecto en 2009 y por brindar comentarios detallados sobre el trabajo a medida que se iba desarrollando. Algunas de las visualizaciones usan listas de tomas en las películas de Vertov creadas a mano. Si bien utilizamos software de detección de tomas en otros proyectos, en este caso tenía más sentido confiar en las anotaciones manuales de las tomas. Este método es más preciso para registrar muchas tomas muy cortas, que son características de las películas de Vertov.

Algunas de las visualizaciones aparecieron previamente como material complementario en el DVD de dos películas de Vertov, publicado por Instituto Austríaco del Cine 11 Dziga Vertov, A Sixth Part of the World / The Eleventh Year. DVD. Edición Filmmuseum, 2009.    ; otras aparecen aquí por primera vez.

 

 1.PANORAMA

1.1. Un parcelado de la dispersión de duraciones de toma promedio de más de mil películas rodadas entre 1902 y 2008. Cada película se representa como un pequeño círculo. Eje x – año. Eje y – duración media de la toma media en segundos. (Eje y utiliza la escala logarítmica). Preparación de datos y exploración: William Huber (Software Studies Initiative), 2008. Fuente de datos: cinemetrics.lv, 2008. Para algunas películas, la base de datos cinemetrics.lv contenía mediciones separadas para cada carrete de película o parte de película; en estos casos, se presentan por separado de cada carrete o parte.

Comenzaré con una vista panorámica del siglo XX y primeros años del XXI y luego poco a poco haré “zoom in” en Vertov. En el gráfico, cada punto representa una película. El eje x es tiempo, y el eje y es la duración promedio de toma (DPT). Los datos provienen de cinemetrics.lv, un importante sitio web utilizado por los investigadores del cine para recopilar información sobre duraciones de las tomas de los films y discutir el trabajo analítico que recupera estos datos. El gráfico muestra todas las películas que estaban en una base de datos de cinemetrics.lv en 2008 (hoy tiene muchas más entradas).

Vamos a ver lo que este gráfico nos puede decir acerca de Vertov. En primer lugar, trazaré por separado veintiocho películas rusas (estaban en la base de datos de cinemetrics.lv cuando obtuvimos los datos de 2008).

1.2. 28 películas rusas contenidas en la base de datos de cinemetrics.lv en 2008. Eje x – año. Eje y – duración media de toma.

La curva dramática refleja las turbulentas idas y vueltas de la historia rusa, los cambios en las políticas culturales del estado, la del lenguaje cinematográfico, y qué películas entraron en la historia del cine. La edición rápida de las películas de montaje de la década de 1920 da paso a la lenta narración clásica de las décadas de 1950-1970. (En este contexto, incluso películas más lentas de Tarkovsky como Solaris 1972 parecen no ser la excepción sino la continuación de esta tendencia). Después del inicio de la Perestroika (1986-), la influencia cultural de occidente conduce a películas de ritmo acelerado, como se ve en la última parte del gráfico.

Los puntos más bajos en el gráfico pertenecen a las famosas películas de los cineastas rusos del “montaje” creadas en la década de 1920: Dziga Vertov, Sergei Eisenstein, Aleksandr Dovjenko, Yakov Protazanov. Si en su lugar cinemetrics.lv incluyera películas populares para el público ruso del periodo –comedias, melodramas y aventura películas producidas en el oeste y en Rusia– este conjunto de puntos desaparecería, y la curva se vería menos dramática. En el otro extremo, algunas de las películas más lentas en la base de datos de cinemetrics.lv son también de un director ruso: Andrei Tarkovski. En contraste con las películas de la década de 1920 de Vertov y otros directores rusos que preferían las secuencias de tomas muy cortas para transmitir significados particulares, las películas maduras de Tarkovsky consisten en tomas que pueden durar unos pocos minutos –una manera de dar el control a los espectadores que son libres de navegar por el espacio en el fotograma. (La toma más larga promedio, que no se muestra en la gráfica, también pertenece a una película rusa - El arca rusa de Sokurov, 2002. Este largometraje fue el primero en la historia del cine mundial rodado como una única toma).

Ahora veamos las películas clásicas del “montaje” de Vertov y Eisenstein frente a todas las otras películas del primer tercio del siglo XX. Las películas de Vertov y Eisenstein mostradas en el gráfico a continuación como rectángulos son Cine-ojo (1924), La huelga (1925), Acorazado Potemkin (1925), Octubre (1928), El undécimo año (1928) y El hombre de la cámara (1929).

1.3. Las películas de Vertov y Eisenstein de 1924-1930 (rectángulos) frente a todas las películas en la base de datos de cinemetrics de 1900-1925. Eje x –año. Eje y – duración media de toma.

 

Detalles:

 2.Duraciones de toma comparadas en dos películas

2.1. Duraciones de toma en El undécimo año (primera imagen) y El hombre de la cámara (segunda imagen). Cada barra representa una toma en una película; la altura de la barra representa la duración de la toma. La diferencia en los largos del gráfico refleja las diferencias en números de tomas entre las dos películas El hombre de la cámara contiene casi tres veces la cantidad tomas de Undécimo año.

Más adelante, enfocaré más en el “paisaje de los datos” de centenares de películas para examinar más de cerca dos películas de Vertov. Trazar las duraciones de todas las tomas revela un número de diferencias interesantes entre ellas, más allá de la observación más obvia de que El undécimo año tiene un número más grande de tomas más largas que El hombre de la cámara. La segunda película, más “teórica” (es decir, es una “visualización más sistemática” de las teorías de Vertov) también está más firmemente estructurada.

Vertov establece patrones temporales particulares de duración de toma. Cada uno de estos patrones se repite un número de veces a lo largo de la película. El gráfico siguiente muestra ejemplos de tres de esos patrones (identificados por números) en una parte de la película.

2.2. Una aproximación a una visualización de El hombre de la cámara que demuestra ejemplos de tres patrones de duración de toma:

1) Una secuencia larga de tomas extremadamente cortas de la misma duración.

2) Tomas largas y cortas que se alternan hacia adelante y hacia atrás.

3) Tomas más largas y más cortas que se alternan, con sus duraciones disminuyendo gradualmente a la misma velocidad.

Quizás el descubrimiento más interesante es que tal padronizado sistemático da cuenta de una parte relativamente pequeña de El hombre de la cámara, con las duraciones de toma en el resto de la película variando sin ningún sistema evidente. En El undécimo año, las partes con duraciones de toma cortas que varían sistemáticamente es incluso más pequeña. (El análisis de series temporales, una técnica estadística para el análisis de datos temporales, confirma la observación que El undécimo año en general tiene menos estructura en la duración de las tomas que El hombre de la cámara).

Este hallazgo tiene sentido. Al ver películas de Vertov de la década de 1920 y principios de 1930, se tiene una sensación de que el cineasta siempre utiliza un principio claro para conectar varias tomas en una secuencia (como que podemos esperar en películas de la escuela rusa del montaje). Sin embargo, estos principios varían a lo largo de la película, y también se pueden combinar en una sola secuencia (las teorías del montaje de Eisenstein identifican varios de estos principios). Usar un número de tomas consecutivas con la misma duración, o variar estas duraciones según un sistema es apenas un principio organizacional entre otros.

Cuando visualizamos una película como El undécimo año a lo largo de una única dimensión donde operan estos principios (tales como duraciones de toma), todas las demás partes de las películas organizadas según otros principios pueden parecer azarosas, ya que la visualización no puede mostrar patrones en estas otras dimensiones. (La visualización 6 a continuación muestra un ejemplo de dicha dimensión: la cantidad de cambio visual en cada toma).

Como podríamos esperar, estas películas corresponden a algunos de los puntos más bajos en los gráficos (es decir, tienen la DPT 12Duración Promedio de Toma menor; Ver “Detalles” más abajo para los números). En particular, El hombre de la cámara tiene el promedio más bajo de duración de toma de todas las películas hechas en la primera parte del siglo XX de entre todas las películas en cinemetrics.lv. También es la “más rápida” entre las demás películas famosas dirigidas por otros cineastas rusos de la escuela de montaje.

Pero hay otra cosa inesperada en el gráfico. Los directores rusos del “montaje” se opusieron fuertemente al cine que hacían otros, alegando que se trataba simplemente de teatro y literatura filmados. En cambio, vieron la yuxtaposición de tomas como el principio organizador de su cine. Para llevar a cabo esta idea en la práctica, a menudo se basaron en tomas muy cortas que fueron de imágenes fijas, casi fijas o que presentan una única acción simple. Cada una de esas tomas debía actuar como un elemento atómico básico e indivisible; la secuencia con significado predeterminado y efecto emocional debía ser construida a partir de estos elementos, como un muro a partir de los ladrillos. Si consideramos estas secuencias más representativas de la teoría del montaje de películas de Eisenstein y Vertov y las comparamos con las películas narrativas populares de la década de 1920, las diferencias son inmediatamente claras.

El gráfico cuenta una historia diferente. La DPT corta de películas más clásicas del montaje ruso continúa la tendencia de DPT de larga a corta que comienza a finales de la década de 1900. En la década de 1910, el cine poco a poco pasó de ser una simulación de teatro a un nuevo lenguaje basado en cortes entre puntos de vista cambiantes. Como resultado, la duración de las tomas disminuyó sustancialmente. Este desarrollo puede verse claramente en el gráfico. Dentro de este contexto más amplio, las películas de montaje ruso ya no constituyen una oposición. En cambio, pueden verse como una continuidad de la tendencia general que había comenzado mucho antes. Si hemos de considerar sólo las estadísticas básicas duración de toma en lugar de visualizar todos los datos, el resultado sería diferente. El promedio de mediciones separadas de DPT en seis películas de Vertov y Eisenstein es 3,13 segundos; esto es casi tres veces menos que el promedio de 7,91 segundos para todas las otras películas de 1921-1930 en la base de datos cinemetrics.

¿Cómo debemos entender nuestro descubrimiento de que las películas del montaje ruso se corresponden con otras películas como se ve en el gráfico de la DPT? No significa que el lenguaje del montaje fílmico de los cineastas rusos no fuera diferente de otro lenguajes fílmicos de la década de 1920, lo fueron (o por lo menos, las partes de las películas estructuradas según principios de montaje). Sin embargo, puede que necesitemos medir y visualizar otra información sobre las tomas (más que solamente la duración de las tomas) para revelar completamente esta diferencia.

(Agradezco a Yuri Tsivian por proporcionar el acceso a la base de datos de Cinemetrics.)

Las películas de Vertov y Eisenstein mostradas en el gráfico 1:

 

Año

Duración promedio de Toma (DPT)

Título en español

Director

1924

4.0

Kino-Ojo

Dziga Vertov

1925

3.0

La huelga

Sergei M. Eisenstein

1925

2.9

Acorazado Potemkin

Sergei M. Eisenstein

1927

2.3

Octubre

Grigori Aleksandrov, Sergei M. Eisenstein

1928

4.0

El undécimo año

Dziga Vertov

1929

 

2.6

El hombre de la cámara

Dziga Vertov

La DPT muestra la duración promedio de la toma en segundos. En vez de la duración promedio, podemos utilizar alternativamente duración de toma media. La media es una representación de la tendencia promedio en un conjunto de datos que es menos sensible a los valores atípicos (en el caso de los dos films de Vertov, algunas tomas inusualmente largos son tales valores)

Si utilizamos la media en vez del promedio, la película de Vertov es “más rápida” que el resto de las películas famosas de sus compañeros del montaje ruso

 

Año

Media de duración de tomas

Título en español

Director

1925

2.3

La huelga

Sergei M. Eisenstein

1926

2.0

Madre

Pudovkin

1927

2.0

Octubre

Grigori Aleksandrov, Sergei M. Eisenstein

1929

1.6

El hombre de la cámara

Dziga Vertov

1928

2.8

El undécimo año

Dziga Vertov

Las mediciones para las películas de Vertov utilizan la interrupción manual de tomas de Adelheid Heftberger que registró la información usando software Anvil y utilizó las impresiones archivísticas de las películas del Museo Austríaco del Cine. Las mediciones para otras películas son de cinemetrics.lv. Debido al método de medición utilizado por la gente que envía los datos a este sitio, éstos pueden no ser totalmente exactos.

3. Las visualizaciones alternativas de duración de tomas

3.1. Una visualización alternativa de las duraciones de toma en El undécimo año. Cada toma se muestra como un círculo, con el tamaño que representa la duración de las tomas. Cada rollo de película ocupa una fila.

3.2 Un primer plano de la visualización. Un número que indica la duración de cada toma (en fotogramas) aparece a la izquierda por encima de un círculo que representa esta toma.

Además de un gráfico de barras que se utiliza en la visualización anterior, también podemos experimentar con muchas otras técnicas gráficas para mostrar cómo cambian los datos a lo largo del tiempo. Por ejemplo, la visualización de esta página utiliza círculos para representar la duración de las tomas en El undécimo año. Esto representa una característica particular que distingue a esta película del Hombre de la cámara –la presencia de un número de tomas muy largas (los círculos grandes en las visualizaciones). Estas tomas largas contradicen nuestra suposición frecuente de que las películas de la escuela rusa del montaje consiste sólo de tomas cortas – creadas por el uso repetido de las famosas secuencias particulares (como la de la escalinata de Odessa en La huelga de Eisenstein) para representar este movimiento de película en los libros de texto sobre cine y otros materiales educativos.

Esta visualización compara patrones de tomas largas en el tiempo en El undécimo año (arriba) y El hombre de la cámara (parte inferior) utilizando rectángulos en lugar de círculos:

3.3. La visualización de tomas largas en El undécimo año (arriba) y El hombre de la cámara (abajo). Cada toma se muestra como un rectángulo. El tamaño representa la duración de la toma.

4. 654 tomas en una sola visualización

4.1. Cada una de las 654 tomas en El undécimo año (Dziga Vertov, 1928) se representa mediante su segundo fotograma. Los cuadros se organizan de izquierda a derecha y de arriba a abajo, siguiendo el orden de las tomas en la película.

Esta visualización convierte a la película en una sola imagen. Utiliza una importante segmentación semántica y visual de la película: la secuencia de tomas. Cada toma es representada por su segundo cuadro. (Yo usé el segundo cuadro frente al primero porque estos últimos suelen ser muy oscuros, debido las limitaciones de la tecnología de la película impresión de la que disponían Vertov y su esposa la montajista Svilova.) Podemos pensar esta visualización como un guión imaginario de la película a partir de una “ingeniería inversa” – un plan de reconstrucción de su cinematografía, edición y narrativa.

4.2. Un primer plano de la visualización.

Este primer plano funciona como un nuevo “montaje” del montaje original de Vertov en la película. Debido a la proporción del primer plano, no muestra una sola secuencia de tomas. Por el contrario, vemos una secuencia de 6 tomas (fila superior), luego saltamos a otra secuencia de 6 tomas (segunda fila), y así sucesivamente, nueve veces. Cada secuencia está separada de la siguiente por el mismo número de tomas (no visibles en una visualización).

Originalmente incluí este primer plano simplemente para ayudar a los lectores a ver mejor las imágenes en la visualización completa (en la página anterior). Más tarde me di cuenta de que su estructura de montaje también ayuda a comprender mejor varios patrones en la edición de la película.

Por ejemplo, notamos las repeticiones de los tomas de distinta gente que mira para arriba (probablemente hacia el futuro comunista). Mientras que este patrón ya se destaca en la visualización completa, el primer plano muestra patrones adicionales. Las tomas de personas mirando hacia arriba se combinan con otras tomas en de modos diferentes. Los dos métodos revelados en el primer plano son el montaje paralelo (filas 1, 4, 5, 9) y una secuencia que consta solamente de estas tomas (fila 8). La repetición puede mostrar tomas de la misma persona (filas 1, 4, 9) o de diferentes personas en la misma posición (filas 5, 8). Por supuesto, un estudio cuidadoso de la película usando herramientas estándar de vídeo digital como QuickTime o Premiere también revelará estos patrones, sin embargo tomará su tiempo, mientras que una visualización los muestra al instante, y también nos permite compararlos.

Asimismo, es sencillo notar que Vertov repite algunas tomas de la gente mirando hacia arriba en la misma dirección (es decir, a la derecha, a la izquierda, o directamente al centro) antes de cambiar la dirección.

Para ver mejor este patrón de repetición y la inversión a través de toda la película, he seleccionado todas las tomas en una película que muestra primeros planos de las caras, y la he visualizado en la secuencia de su aparición en la película (una vez más, cada toma es representada por su segundo cuadro).

4.3. 72 tomas mostrando primeros planos de rostros en El undécimo año, dispuestas en orden de su aparición en la película (de izquierda a derecha, de arriba a abajo). Los niveles de gris de algunos fotogramas fueron ajustados para revelar más detalles.

Por lo general, un conjunto de fotografías de una o varias personas mirando en la misma dirección pertenece a una sola secuencia. Estas tomas establecen una estructura de repeticiones yuxtapuestas con una serie de diferentes tomas montadas entre las tomas de las caras. Sin embargo, la visualización también muestra un meta-patrón: a través de toda la película, una secuencia de fotos con caras mirando en una dirección a continuación es seguida por una secuencia de tomas en la dirección opuesta; la secuencia siguiente invierte la dirección otra vez, y así.

Podemos también combinar la representación de los planos por sus fotogramas seleccionados con un gráfico de barras que representa alguna propiedad de estas tomas. En la siguiente visualización del Undécimo año, cada toma de la película es representada por su segundo cuadro; la longitud de una barra del fotograma representa la duración de la toma.

Cada fila corresponde a un carrete de la película (abajo hacia arriba). Durante la proyección de la película en la década de 1920, hubo una rotura entre cada carrete. Vertov tuvo esto en cuenta en la edición de la película - por eso es más significativo ver cada carrete por separado en lugar de ponerlos todos en un solo gráfico.

4.4. La visualización de El undécimo año.

Cada fila corresponde a un carrete de la película (de abajo hacia arriba).

Cada toma de la película es representado por su segundo fotograma.

Los números de toma aparecen debajo de cada imagen (esquina derecha).

La altura de una barra debajo de cada cuadro corresponde a la duración de la toma  (1 fotograma = 1 pixel).

El número debajo de una barra muestra la duración de la toma en fotogramas.

Los dos siguientes planos de la visualización 4.4 ilustran diversos patrones de edición en la película. Uno (superior) es una secuencia de tomas con la misma duración –a partir de la toma 590. Otro (inferior) es la secuencia que alterna entre las tomas de los títulos con la misma duración (fotogramas 13, 15, 17, 19) y las tomas con la disminución de duración (14, 16, 18). (Cada primer plano muestra sólo una parte de la secuencia más larga).

4.4. Dos primeros planos del inicio (abajo) y el final de la película (arriba).

5.  Comparando el inicio y el final de cada toma

5.1. Visualización del Undécimo año comparando los fotogramas del principio y el final de cada toma.

Cada columna representa una toma en la película usando el segundo del fotograma del comienzo (fila superior) y el segundo del fotograma final (fila inferior). Las tomas se organizan de izquierda a derecha siguiendo el orden en la película.

Primera imagen: La visualización completa de toda la película.

Segunda imagen: Un primer plano de la visualización completa.

Ver visualización de resolución completa (60.000 píxeles de ancho) en Flickr:

http://www.flickr.com/photos/culturevis/5674891152/in/set-72157623326872241

5.2. Más primeros planos, mostrando principio y final de siete tomas consecutivas.

5.3. Otros primeros planos que muestran el principio y el final de otra secuencia de siete tomas consecutivas.

Para crear esta visualización, escribí un programa que selecciona los fotogramas del principio y del final de cada toma en El undécimo año y los coloca juntos en el orden de tomas Para cada toma, un fotograma desde su comienzo en la parte superior y el fotograma del final está debajo.

“Vertov” es un neologismo inventado por el director de la película que lo adoptó como su apellido al comienzo de su carrera. Viene del verbo ruso vertet, que significa “rotar”. “Vertov” puede referirse al movimiento manual básico requerido para el rodaje en los años 1920: hacer rotar de la manivela de una cámara. También puede referirse a la dinámica del lenguaje cinematográfico desarrollado por Vertov que, junto con otros cineastas, diseñadores y fotógrafos rusos y europeos en esa década, querían “desfamiliarizar” la realidad utilizando composiciones dinámicas diagonales y tomas desde puntos de vista inusuales. Sin embargo, esta visualización sugiere una imagen muy diferente de Vertov. Casi cada toma del Undécimo año comienza y termina prácticamente con la misma composición y tema. En otras palabras, las tomas son en gran parte estáticas.

Al volver a la película real y estudiar estas tomas aún más, encontramos que algunas de ellas son de hecho completamente estáticas –como los primeros planos de rostros mirando en varias direcciones sin moverse. Otras tomas emplean una cámara estática, que encuadra algún movimiento –como máquinas operando, o los obreros en el trabajo– confinados a la misma zona del espacio. Aquí nos recuerda que un número de tomas en la película más famosa de Vertov, El hombre de la cámara (1929), fueron especialmente diseñadas como opuestos: filmar desde un vehículo en movimiento implicaba que los sujetos estuvieran atravesando constantemente la visión de cámara. Pero incluso en éste, el más experimental de los films de Vertov, esas tomas constituyen una parte muy pequeña de la película.

6.  Promedio de cambio visual en cada toma

6.1. Promedio de cambio visual en cada toma en El undécimo año.

Cada barra representa una toma. La longitud de una barra corresponde a la cantidad promedio de cambio visual en la toma (más detalles sobre cómo se calculó esto puede encontrarse en “Método” más adelante). El segundo fotograma de una toma se ubica sobre la barra.

Primera imagen: la visualización completa de toda la película.

Segunda imagen: un primer plano de la visualización.

Tercera imagen: un primer plano más ajustado que muestra el patrón de cambios graduales en la cantidad promedio de cambio visual de las tomas.

Véase en Flickr la visualización con resolución completa (60.000 píxeles de ancho):

http://www.flickr.com/photos/culturevis/4117658480/in/set-72157632441192048

Esta visualización utiliza un algoritmo muy simple (se describe a continuación) para calcular el promedio de cambio visual en cada toma en la película de Vertov. Cada columna corresponde a una toma. El segundo fotograma (desde el principio) de una toma está arriba; la barra que representa la medida de la cantidad promedio de cambio visual en esta toma está debajo. Para una toma donde poco cambia, la barra será corta; una toma con muchos cambios (sean los movimientos de una cámara, o los temas, o ambos) tendrá una barra larga. Un plano fijo de dos personas hablando es el ejemplo de lo primero; un plano filmado desde un vehículo en movimiento rápido es ejemplo de lo segundo.

La visualización de estas medidas revela tanto los patrones que podemos esperar, como otros que son absolutamente sorprendentes. El primer plano de la visualización de la película completa que se muestra a continuación (6.2.) ilustra un patrón que podemos anticipar en una secuencia de corte cruzado: dos tomas cortas alternado hacia adelante y hacia atrás, cada una con su propio nivel de actividad visual.

6.2.

El primer plano a continuación muestra un patrón diferente que parece contradecir totalmente nuestras expectativas de una película del montaje soviético: el promedio de cambio visual en cada toma al principio disminuye gradualmente y luego aumenta gradualmente. Este patrón de aumento/disminución gradual en la cantidad de actividad se produce varias veces a lo largo de la película.

6.3.

Vertov y un número de cineastas rusos (Sergei Eisenstein, Lev Kuleshov, Vsevolod Pudovkin) abogaron por el montaje como el principio organizador fundamental del cine. Si bien propusieron una serie de teorías alternativas de montaje, lo común a éstas y sus películas fue la idea de un choque entre tomas, es decir, generación de significado y efectos emocionales a través de la yuxtaposición más que de la continuidad. (En cambio, en la progresión de la edición de una película normal, las tomas cumplen el propósito principal de hacer avanzar la narrativa).

Sin embargo, como el ejemplo de arriba muestra, la oposición y continuidad no son siempre enemigos. En este ejemplo, las primeros planos y tomas medias que se alternan se oponen entre sí gráficamente. Al mismo tiempo, la cantidad de cambio visual en cada toma disminuye gradualmente y luego aumenta con el tiempo.

¿Vertov y sus colaboradores Mikhail Kaufman y Yelizaveta Svilova eran conscientes de este patrón sutil? El hecho de que las tomas en una secuencia sigan un patrón no es sorprendente. Los teóricos rusos del montaje abogaban por que las tomas debían disponerse en una secuencia siguiendo algún sistema (por ejemplo, Eisenstein distingue entre “montaje métrico”, “montaje rítmico”, “montaje intelectual”, etc.). Sin embargo, puesto que no tenían herramientas computacionales, no podían analizar precisamente los cambios visuales cuadro a cuadro, o toma a toma y así planificar sistemáticamente los patrones sutiles de cambio de dimensiones tales como “la cantidad promedio de cambio visual por toma” utilizado en nuestra visualización. Esto no impediría a Vertov y sus colaboradores crear esos patrones “a mano” –incluso si no podían ser representado gráficamente y nombrado hasta ahora.

Detalles:

 

En esta película de Vertov, no existe correlación entre la duración de las tomas y la cantidad promedio de cambio visual, de acuerdo a lo medido con nuestro método descripto a continuación (correlación = -0,06). Mientras que en general muchas cosas pueden producir “cambio visual” (pensemos en los films experimentales del siglo XX o la animación contemporánea), en las películas de Vertov los cambios visuales entre los fotogramas se deben a los movimientos (de objetos, de cámara o ambos al mismo tiempo). Si usamos esta sustitución, podemos afirmar que las cantidades de tomas en movimiento y la duración de las tomas no tienen ninguna conexión entre sí. (Esto es comparable a la conclusión general de Cutting y sus colaboradores para las películas previas a la Segunda Guerra Mundial que ellos estudiaron 13Cutting, Brunick, DeLong, Iricinschi, y Candan, “Quicker, faster, darker: Changes in Hollywood film over 75 years”, i-Perception (2011) vol. 2, pp. 569-576, http://people.psych.cornell.edu/~jec7/pubs/iperception.pdf. Los detalles del método se describen en Cutting, DeLong, Brunick, 2011b “Visual activity in Hollywood film: 1935 to 2005 and beyond,” Psychology of Aesthetics, Creativity, and the Arts 5 (2011), pp. 115-125).

El análisis de series temporales (autocorrelación y autocorrelación parcial calculada usando http://www.wessa.net/rwasp_autocorrelation.wasp) de los datos de duración de toma y el de los datos de movimientos de toma muestran ambos estructuras fuertes (es decir, lo contrario de la aleatoriedad). Esto significa que ambos valores cambian sistemáticamente en una porción significativa de las películas.

Comparativamente, los datos de la duración de las tomas tienen más estructura que los de la cantidad promedio de tomas de movimiento (de acuerdo cómo lo medí; ver más abajo). Esto tiene sentido: mientras Vertov podía planificar la duración exacta de cada toma, no tenía la manera de hacer lo mismo para el movimiento. Al examinar visualmente los gráficos, también vemos que la proporción de la película que sistemáticamente presenta diferentes tomas largas es mayor que la parte que tiene patrones de movimiento sistemáticos.

El método para medir la cantidad promedio de cambio visual en una toma:

Para calcular el promedio de cambio visual en una toma, he implementado en software el siguiente método. Cada dos fotogramas seguidos se restan el uno del otro, píxel por píxel. A continuación, el programa calcula la media (promedio) de todos los valores de escala de grises de la imagen de diferencia. Luego se añaden los valores promedio para todas las imágenes de diferencia, y el total es dividido por el número de fotogramas en la toma.

 

La ilustración siguiente muestra imágenes de la diferencia de dos conjuntos de fotogramas consecutivos:

6.4. Ejemplos de imágenes diferenciales. En cada fila, las columnas primera y segunda muestran fotogramas seguidos de El undécimo año; la tercera columna muestra su imagen diferencial.

Fila superior: dos fotogramas de una toma filmados desde un barco en movimiento lento. Hay un pequeño cambio entre los fotogramas y la correspondiente imagen diferencial contiene sólo un pequeño número de píxeles no negros.

Fila inferior de: dos fotogramas de una toma que muestra un trabajador operando maquinaria. Las partes de los fotogramas que corresponden a los píxeles no negros de la imagen diferencial. Como puede verse en este ejemplo, hay significativamente más cambio de fotograma a fotograma.

Creo que nuestro método para medir el cambio visual es comparable al utilizado por Cutting y sus colaboradores en su serie de estudios de 160 películas de Hollywood 14 Cutting, Brunick, DeLong, Iricinschi, y Candan, “Quicker, faster, darker: Changes in Hollywood film over 75 years”, i-Perception (2011) vol. 2, pp. 569-576, LINK Los detalles del método se describen en Cutting, DeLong, Brunick, 2011b “Visual activity in Hollywood film: 1935 to 2005 and beyond,” Psychology of Aesthetics, Creativity, and the Arts 5 (2011), pp. 115-125 –al menos en el caso de las dos películas de Vertov. En su método, calcula la media de las correlaciones entre fotogramas adyacentes próximos (1 y 3, 2 y 4, etc.) En mi método, calculo la media de la diferencia de la escala de grises de la imagen entre cada par de cuadros sucesivos (1 y 2, 2 y 3, etc.) Para comprobar si los dos métodos son comparables, procesé un número de tomas en El undécimo año para calcular correlaciones de estructura y escala de grises promedio de las imágenes diferenciales y trazar las gráficas correspondientes. También probé otras mediciones: número de píxeles que cambian de fotograma a fotograma, media de escala de grises de imágenes diferenciales y también la suma de los valores de todos los píxeles de una imagen diferencial (Las visualizaciones en la sección 9 a continuación utilizan éste último método). En todos los casos, los resultados fueron similares.

Para calcular las correlaciones entre los fotogramas siguientes, usé ImageJ con el plug-in ImageCorrelationJ 15://www.gcsca.net/IJ/ImageCorrelationJ.html

7. Fotogramas ordenados por sus propiedades visuales

3.1. Visualización de El undécimo año que muestra el segundo fotograma de cada toma. Los fotogramas están ordenados por sus propiedades visuales. Eje x – media (promedio) del valor de escala de grises de un fotograma. Eje y – número de formas en un fotograma. Téngase en cuenta que debido a la superposición, no todos los 654 fotogramas son visibles.

En esta visualización, los cuadros que representan 654 tomas en El undécimo año en dos dimensiones de acuerdo a sus características visuales medidas automáticamente por el software. Muchas combinaciones visuales características diferentes pueden ser utilizadas, creando cada una un “mapa” diferente de una película. Aquí se colocan los fotogramas según su escala de valores de grises promedio (eje x) y el número de formas (eje y). Los fotogramas oscuros están a la izquierda, mientras que los fotogramas luminosos están a la derecha.

Los fotogramas que contienen sólo unas pocas formas están en la parte inferior, mientras que los fotogramas con muchos objetos están en la parte superior.

En cuanto a sus valores de escala de grises (eje x), las tomas en la película se dividen aproximadamente de modo uniforme entre tonos grises muy oscuros, medios y muy claros. La oposición entre proporciones grandes de tomas muy claras y muy oscuras es específica del Undécimo año. Las primeras son tomas en exteriores, con el cielo ocupando la mayor parte de una toma. (Como ya comenté anteriormente, muchas tomas muestran personas mirando hacia arriba. No es difícil entender el simbolismo de estas tomas: gente mirando hacia el futuro comunista). Las tomas oscuras representan la industrialización, que muestran personas que operan maquinaria y fabricación de acero.

En cambio, El hombre de la cámara sucede en una ciudad, abarcando un día entero desde la mañana a la noche. En consecuencia, la distribución de sus tomas es más pareja, con cada tono de gris igualmente representado.

 

7.2. Cada centésimo cuadro de El hombre de la cámara. Los fotogramas se organizan por brillo medio (eje x) y el número de formas (eje y).

 

7.3. Un primer plano de una visualización del Undécimo año: tomas con valor promedio de escala de grises altos y cantidad baja de formas.

7.4. Otro primer plano del Hombre de la cámara: tomas con tonos de grises medios

8.  Cuadro por cuadro: anatomía de una toma

Esta sección analiza una toma de El undécimo año. Ver el videoclip aquí:

http://www.youtube.com/watch?v=_0bE9suAIDQ&feature=share&list=UUQYMh3afEnBHnwcJ8y-e9Mg

 

La siguiente ilustración muestra fotogramas muestreados de esta toma:

8.1. Una toma de El undécimo año que consta de 167 fotogramas. Este montaje cada 21 fotogramas; los fotogramas se disponen de izquierda a derecha, de arriba hacia abajo.

 La escuela ruso de montaje privilegiaba la toma como la unidad básica del cine. Sin embargo, si nos fijamos en sus películas frente a sus textos teóricos y manifiestos, nos encontramos con que la realidad no siempre se corresponde a la teoría.

El undécimo año contiene muchas tomas cortas que son cuadros estáticos (o casi estáticos). Contienen una sola “explosión” de información, presentada en la pantalla sólo el tiempo suficiente para que un espectador la absorba y luego son sustituidos por la siguiente explosión. La película también contiene tomas dinámicas más largas que muestran cierta actividad que sigue un ciclo. Además de comunicar información semántica (un ser humano o una máquina realizando alguna acción) tales tomas también comunican el tema más grande del trabajo, central a la película. Porque son movimiento característico, no solo significan “trabajo”, por el contrario, motivan a los espectadores a unirse a los trabajadores que ven en la pantalla. También podemos encontrar un tercer tipo de tomas que no contienen repeticiones; en cambio, comunican una nueva información a medida que se desarrolla la toma. (Algunas de estas tomas están filmadas desde un tren; a medida que el tren avanza, vemos nuevas partes del paisaje, o nuevos objetos pasando).

¿Cómo podemos visualizar el desarrollo de un única toma? Como ejemplo, seleccioné una toma que ejemplifica con pureza la estética de Vertov: formas geométricas de la máquina en movimiento. En su primer texto publicado “Nosotros: La variante del manifiesto” (1920), el joven Vertov afirma categóricamente:

La máquina nos hace avergonzarnos de la incapacidad del hombre para controlarse a sí mismo.

Por su incapacidad para controlar su movimiento, NOSOTROS excluimos temporalmente a hombre como el tema de la película.

 Esta adoración de máquinas era típica de los programas estéticos de muchos y diversos grupos de vanguardia en la década de 1910-1920, incluyendo a artistas visuales, poetas, arquitectos, fotógrafos y diseñadores gráficos. Vertov adapta este programa general de la vanguardia europea al medio del cine. Lo que él toma de máquinas es la precisión y regularidad de sus movimientos. (Vertov al parecer no era consciente de los métodos de estudio del tiempo de Taylor y los estudios de movimiento los Gilbreth ya desarrollados en la década de 1920. Estos métodos se utilizaron para estandarizar y racionalizar a los movimientos de los trabajadores, ajustándolos para alcanzar el ideal de precisión maquínico. En Rusia las ideas de Taylor se popularizaron a comienzos de los años ‘20).

La toma que seleccioné dura 167 fotogramas, y no contiene seres humanos. En cambio, la cámara sigue a lo largo de una grúa larga que se extiende perpendicular a sí misma. La geometría que se despliega contiene una parte horizontal que ocupa la misma parte de los fotogramas; dos partes verticales que atraviesan rápidamente los fotogramas 1-50 y luego otra vez los 100-167; y la parte larga de la grúa, que es perpendicular a la cámara. Debido a que la cámara hace un paneo, la posición de esta parte cambia continuamente a lo largo de toda la toma.

 

Aquí están algunas maneras posibles de visualizar una toma (muchas otros también son posibles). En la primera visualización, a continuación, todas los fotogramas en la foto fueron promediados juntos, píxel por píxel. En esta visualización los objetos que aparecen en la toma sólo brevemente no son visibles. Los objetos que aparecen en la misma posición durante períodos de tiempo se muestran como recortes oscuros y marcados (por ejemplo, una línea oscura en la parte inferior). ¿Y qué hay de los objetos en movimiento? En este plano, la cámara hace un paneo para mostrar parte de una larga grúa que se extiende perpendicular a la misma. Debido a que la cámara hace un paneo, la posición de la parte de la grúa cambia continuamente a lo largo de toda la toma. En la visualización, este movimiento se traduce en la forma borrosa triangular; mientras más rápido sea el movimiento, más borrosa será su representación.

8.2. 167 fotogramas comprendiendo la toma promediada en conjunto. Ya que tales imágenes compuestas tienden a tener bajo contraste, he aumentado la gama de niveles de grises en Photoshop. 

 

En lugar de agregar todos los fotogramas, podemos en cambio agregar subconjuntos de fotogramas, generando una serie de imágenes. En la siguiente visualización, cada imagen es el resultado de la adición de 10 fotogramas posteriores:

8.3. Cada una de 16 imágenes muestra los 10 fotogramas subsiguientes de la toma reunidos.

Esta visualización nos permite ver más claramente el cambio de la velocidad del movimiento relativo de la grúa (digo relativo porque en realidad la grúa está quieta, y la cámara hace un paneo a través de la misma). Las imágenes muy desenfocadas corresponden al movimiento más rápido (al principio y final de la toma); las imágenes más nítidas corresponden al movimiento lento (al medio de la toma).

Otro método para rastrear lo que sucede dentro de una toma es utilizar gráficos. Arriba (visualización 6) graficamos la cantidad promedio de cambio visual por toma en toda la película. Podemos utilizar el mismo método para medir y graficar los cambios de fotograma a fotograma en una única toma.

En primer lugar, generamos imágenes de diferencia para cada par de fotogramas. Una “imagen de diferencia” representa los cambios entre dos fotogramas consecutivos. En el ejemplo siguiente, los píxeles correspondientes que no cambian entre los dos fotogramas son negros; los píxeles que cambiaron tienen valores más luminosos.

Puede ver un video de imágenes de la diferencia para el toda la toma en línea: http://www.youtube.com/watch?v=zCcQq3J7OLA&list=UUQYMh3afEnBHnwcJ8y-e9Mg&index=2

 

La ilustración debajo muestra los tres fotogramas del video:

8.4. Selección de imágenes de diferencia generadas restando fotogramas posteriores de la toma.

De arriba a abajo: imágenes de diferencia para fotogramas 37-38, 77-78, 133-134.

 Las imágenes superior e inferior corresponden a partes de la toma cuando la cámara pasa de la parte vertical de la grúa. Debido a que estas partes están cerca de la cámara, su movimiento genera grandes diferencias entre los fotogramas subsiguientes. La imagen de diferencia media corresponde a la parte de la toma en que la cámara pasa la parte de la grúa que esta perpendicular a la misma. Debido que a esta parte extendida está más lejos de la cámara, los cambios en su posición se traducen en números más pequeños de píxeles que cambian de fotograma a fotograma.

Después de generar estas imágenes de diferencia para cada dos fotogramas en un plano, medimos información de escala de grises en cada imagen de diferencia y luego trazamos estas mediciones en el tiempo. Diferentes medidas pueden ser usadas, pero en general tienden a producir resultados similares. En el apartado 6, utilizamos la media de la escala de grises de una imagen de diferencia, aquí utilizaremos una medida alternativa: la suma de valores de pixel en cada imagen (el software ImageJ con el que yo solía hacer automáticamente estas mediciones lo llama Densidad Cruda Integrada: http://imagej.nih.gov/ij/docs/menus/analyze.html).

 

El siguiente gráfico mapea esta medición para todos los 167 fotogramas de la toma. Para hacer el gráfico más comprensible, puse debajo 9 fotogramas clave de la toma. Cada fotograma clave fue muestreado a intervalos de 20 fotogramas, comenzando en el fotograma 1.

8.5. El gráfico de las diferencias de fotograma en la toma del Undécimo año. La medida de la diferencia entre fotogramas subsiguientes utilizada es la Densidad Cruda Integrada de una imagen de diferencia. Nótense los picos ocasionales en el gráfico. La razón de los mismos son los saltos entre ciertos fotogramas, que son los “artefactos” 16NdT:  Por “artefactos” Manovich se refiere a marcas características de una tecnología particular  del registro original de la película. Si la misma toma fuera registrada con una cámara contemporánea, estos picos desaparecerían.

Las mediciones singulares de cambio visual entre pares de fotogramas tales como media de escala de grises de una imagen de diferencia, o su densidad cruda de pixel reducen todos los cambios de visuales a un único número. Por lo tanto, no nos permiten realizar un seguimiento separado de las dimensiones de una toma: movimientos de objetos particulares, la composición, la posición de la cámara, los gestos de  la gente y sus caras, etc.

Snow), ningún gráfico singular puede capturar todos los cambios que uno puede ver con sus ojos. Mientras que podemos construir muchos gráficos que muestren patrones en muchas dimensiones separadas en una sola toma, puede que aún no capturen la Gestalt general que experimentamos al ver la toma.

Sin embargo, los gráficos tienen sus ventajas específicas: al representar los cambios en distintas dimensiones visuales con curvas, nos dan un lenguaje visual para hablar de los patrones temporales. En el gráfico anterior podemos ver dos picos (alrededor del fotograma 37 y el 137) que corresponden a los momentos en que las piezas verticales de la grúa atraviesan el fotograma. También podemos ver que el movimiento de barrido de la larga parte perpendicular de la grúa (la parte entre los dos picos) se traduce en aproximadamente la misma tasa de cambio visual. El gráfico confirma también que la tasa de cambio de la primera parte de la toma (0-37) es mayor que en la última parte (137-168). (Los saltos en el valor de fotograma a fotograma reflejan los artefactos en el registro de la película.)

9.  Visualización del movimiento

Esta sección analiza tres tomas de El hombre de la cámara. Véase el vídeo clip con estas tomas aquí:

http://www.youtube.com/watch?v=PV-FzvHi0lk&feature=share&list=UUQYMh3afEnBHnwcJ8y-e9Mg

 

La siguiente ilustración muestra fotogramas muestreados de esta toma:

9.1. Tres tomas consecutivas del Hombre de la cámara. Las duraciones de las tomas son de 94, 115 y 138 fotogramas.

El montaje que se muestra utiliza cada veintiunavo fotograma de esta secuencia.

En el mismo manifiesto “Nosotros” (1920) citado al comienzo, el joven Vertov define su cine (aún por crearse) como el arte de organizar los movimientos:

Kinochestvo es el arte de organizar los movimientos necesarios de los objetos en el espacio como un todo rítmico artístico.

El cine, 17es además el arte de inventar los momentos de las cosas en el espacio en respuesta a la demanda de la ciencia.

¿La práctica, que vino más adelante, hizo encajar estas declaraciones mucho antes? Al mirar películas como El undécimo año y El hombre de la cámara nos encontramos con que sólo algunas partes de las películas utilizan movimientos de objetos en el espacio como el principio de organización. Otras partes contienen secuencias de tomas estáticas o con movimiento escaso o lento.

Esta impresión se confirma si analizamos las películas. Adelheid Heftberger ha anotado manualmente la información de movimiento en cada toma de estas películas utilizando un número de etiquetas. En El undécimo año, etiquetó sólo el 7% de las tomas como “movimiento rápido”; ella asigna la etiqueta “sin movimiento” a 22%. Como podríamos esperar luego de ver las dos películas, en El hombre de la cámara, el porcentaje de tomas etiquetadas como “movimiento rápido” fue mucho mayor (30%), pero todavía representa sólo un tercio del film. Sin embargo, la idea inicial de Vertov del cine como una organización de “los movimientos de los objetos en el espacio” es importante. Podemos encontrar esta técnica más adelante en numerosas películas del siglo XX, más allá de las partes claves de las películas de Vertov. Pero para estudiar los movimientos con mayor precisión y a gran escala, necesitamos técnicas automáticas para el rastreo del movimiento, análisis y visualización. ¿Por dónde empezamos?

En la introducción señalé que el desarrollo de medios de registro visual en el siglo XIX fueron de la mano con la invención de técnicas para capturar los movimientos para su análisis por parte de Marey, los Gilbreth y otros. En el siglo XX rotoscopear –el trazo manual de movimientos filmados de actores– se convirtió en una técnica importante en la industria de la animación. En las últimas décadas del siglo, han sido desarrollados más métodos automáticos para la captura de movimiento y el análisis que utilizan computadoras y expanden las técnicas originales de Marey y los Gilbreth. Tales técnicas han sido adoptadas en muchos campos que abarcan desde los deportes y la producción de video juegos a la vigilancia y la navegación automática de automóviles. Dada la ubicuidad de las cámaras de video baratas, la detección, el rastreo y la identificación de actividad basada en el movimiento (incluyendo el análisis de la conducta) con registros de video se ha convertido en un área en particularmente grande de la investigación en ciencias de la computación.

 

Los informáticos han desarrollado una serie de técnicas automáticas para la estimación y seguimiento de movimiento, y estas técnicas están integradas en las tecnologías digitales más básicas. Por ejemplo, los códecs de vídeo MPEG utilizan estimación de movimiento automático para comprimir el video.

9.2. Planar tracker en el popular NUKE 6.3, uno de los software más extendidos utilizados en la producción de TV y cine para el seguimiento del movimiento

 

9.3. El uso típico de la captura de movimiento en el cine y los videojuegos: los movimientos de un actor son capturados y se utilizan para animar un personaje.

La mayoría del software para animación, composición y efectos visuales también ofrece una serie de técnicas que utilizan métodos manuales, automáticos o su combinación (se proporciona un  resumen integral del seguimiento en la producción de cine y vídeo en 18 La descripción completa de los conceptos, tecnologías y sus aplicaciones puede encontrarse en este conjunto de Artículos de Wikipedia:

http://en.wikipedia.org/wiki/Camera_tracking

http://en.wikipedia.org/wiki/Match_moving

http://en.wikipedia.org/wiki/Motion_estimation

http://en.wikipedia.org/wiki/Motion_capture ). Todos los personajes animados de videojuegos y películas hoy utilizan la captura de movimiento y de gestos faciales de actores en vivo. Las películas y los avisos publicitarios también recurren al seguimiento de movimientos de objetos y cámara en imágenes de vídeo para combinar registro de acción viva y gráficos de computadora. De hecho, el seguimiento y la captura de movimiento tal vez sean tan fundamentales para la producción de cine y video de principios del siglo XXI como el desarrollo de la edición lo fue hace cien años. (En este sentido, la idea del cine como el arte de mover cosas en el espacio propuesto por Vertov a los 24 años en 1920 se anticipo tanto a la tecnología más importante de temprano siglo XX y a la estética de muchas películas de fantasía y acción posibilitadas por estas tecnologías. ¡Imaginemos lo que Vertov hubiera hecho si hubiera tenido acceso a estas tecnologías en su tiempo!).

Por lo general, en la producción profesional de cine y vídeo hoy, el seguimiento de movimientos dentro de una toma singular requiere de cierto tiempo, y la calidad de los resultados y del tiempo insumido dependen del tipo de toma 19 Para una historia parcial de seguimiento en la producción de efectos visuales hasta 2004, vea Mike Seymour, “Art of tracking Part 1: History of Tracking,”fxguide.com, 24/08/2004, http://www.fxguide.com/featured/art_of_tracking_part_1_history_of_tracking/.. Sin embargo, la cuestión más desafiante de usar un método para analizar los movimientos en las películas de Vertov o de cualquier otro director no es técnico sino teórico. Imaginemos que hemos conseguido seguir cada movimiento de cada objeto en la película completa a través de cientos o miles de tomas: ¿Cómo visualizar, analizar e interpretar estos datos? En el caso de las duraciones de toma medias, los datos son unidimensionales (una secuencia de números que representan las duraciones de las tomas en una secuencia) pero, ahora, nosotros podemos tener centenares de números para cada segundo que representa movimientos de potencialmente decenas de objetos en cada toma.

Para ilustrar este desafío conceptual, utilizaré el extremadamente sencillo “método del juguete” para visualizar el movimiento que ya apareció en la sección anterior (8.2): promediar todos los fotogramas de una toma juntos. Este método funciona sólo parcialmente, pero sirve para ilustrar. Aquí están algunos promedios de tres tomas de un clip arriba creado mediante el método descrito en la sección 6.

9.4. Las visualizaciones del movimiento en tres planos de El hombre de la cámara utilizando técnicas de promedio de fotogramas. El video de las tomas se muestra en 9.1.

Como expliqué antes, cuando aplicamos esta técnica para mapear una toma en una sola imagen, los objetos que aparecen en el fotograma sólo brevemente o se mueven rápido en el espacio desaparecen; los objetos que se mueven más lentamente por períodos más largos de tiempo se traducen como partes borrosas de la imagen.

En la visualización de la primera toma (9.4, izquierda), el movimiento principal de la tranvía está bien representado. En la visualización de la segunda toma (9.4, centro), los resultados son menos exitosos: se conserva el movimiento del arco del tranvía, pero el coche en marcha, más rápido, casi desaparece. En la visualización de la tercera toma (9.4, derecha), todo lo que podemos decir es que algunos movimientos ocurrieron donde la imagen esta borrosa, pero no podemos decir nada más.

Con todo, la técnica es parcialmente exitosa en hacer visible “grandes” movimientos que tienen una geometría simple (aquí, los tranvías en movimiento), pero la mayoría de los “pequeños” movimientos (aquí, la gente en la calle, o las manos de la mecanógrafa) no se conservan. Tomo su falta de visibilidad en estas imágenes como una metáfora para el desafío conceptual de describirlos.

¿Qué haríamos con los recorridos de todas las personas en las dos primeras tomas si pudiéramos obtenerlos? No es fácil de describir conceptualmente— y sin embargo, creo que son tan importantes para estas tomas como los movimientos de gran escala de los tranvías. (Las descripciones verbales que hace Gilles Deleuze de diferentes tipos de movimientos cinematográficos en su libro La imagen-movimiento: Estudios sobre cine son a la vez fascinantes y frustrantes para leer, en la medida en que somos testigos de su lucha para expresar lingüísticamente la variedad de los movimientos en el universo del cine20  ).

 

Este artículo ilustra algunas de las muchas otras maneras posibles de visualizar cine: desde la escala de miles de películas hasta una única toma. Los nuevos lenguajes del cine y las nuevas formas cinemáticas que comenzaron a desarrollarse a mediados de la década de 1990 como resultado de la adopción de herramientas de software y el flujo de trabajo digital exigen sus propias técnicas de visualización. Los videos de motion graphics que a menudo no tienen objetos discretos o contenido representacional permiten una visualización particularmente interesante, una aproximación que describiré en un próximo artículo. Porque el movimiento es aún más crucial para los motion graphics (como el propio nombre lo indica) que para los largometrajes, desarrollar técnicas adecuadas para la visualización del movimiento en estas obras debería permitir reutilizarlas con las películas de Vertov. Idealmente, vamos más allá de su deseo de “símbolos gráficos del movimiento” para crear visualizaciones y herramientas de análisis más exactas, expresivas y ricas que nos permitan ven cine de nuevas maneras.

 

 
Como citar:
Manovich, L. (2017). Visualizar a Vertov, laFuga, 19. [Fecha de consulta: 2017-10-19] Disponible en: http://2016.lafuga.cl/visualizar-a-vertov/821