10-11 Hrs. Lunes, Martes y Jueves. Salón P-118. FC,UNAM.


jueves, 8 de noviembre de 2007

Tarea II

Hola a todos.

Es hora de su segunda muy esperada tarea.

La tarea no es corta, así que es importante que empiecen a hacerla con bastante tiempo de anticipación para que puedan generar y les podamos resolver dudas. El tiempo que requieren es definitivamente menor al tiempo que les hemos dado para hacerla, pero si tienen alguna duda es mejor que la resuelvan con tiempo, por si, en el peor de los casos, tienen que volver a hacer todo. También deben tomar en cuenta que se requerirán tiempos talvez largos de cómputo, por lo que dejarlo para el último día definitivamente no es una opción.

Todos los pasos aquí descritos se pueden hacer en una hoja electrónica de cálculo. Sin embargo, si manejan matlab o algo parecido les resultará más fácil. Por supuesto, la programación estructurada les haría la vida aún más fácil. La programación orientada a objetos talvez sea excesiva, y la programación funcional o lógica muy difícil de aplicar.

1. Aquí hay 8 conjuntos de datos de Electro Encefalograma, escojan uno de ellos y justifiquen su eleccion. Llamemos E(t) a esta serie de tiempo.

2. Generen la serie S(t) con 30504 valores de sen(t), con un espaciamiento g regular entre cada t, no mayor a Pi/10.

3. Generen la serie R(t) con 30504 números aleatorios generados con el generador de números aleatorios.

4. Generen la serie C(t) con 30504 valores da tal forma que
C(1)=0.693850491132 y C(t+1)=3.99818701*C(t)*(1-C(t))

5. Redondeen los valores de las series E,S,R,C de tal forma que solo tomen 10 valores distintos uniformemente distribuidos en el intervalo entre el máximo y el mínimo de cada serie. Es decir, si su serie R va del 0 al 100, la redondean para tener solo valores: 0 10 20 30 40 50 60 70 80 90. Esto les generara cuatro series: E* S* R* y T*, todas ellas seguiran teniendo 30504 valores. Esto de redondear es equivalente a disminuir la resolución del instrumento con el que "midieron" la serie, de tal forma que, en el ejemplo anterior, su instrumento no distingue entre 10, 11, 12, 13 y 14.

6. Redondeen los valores de las series E,S,R,C de tal forma que solo tomen 100 valores distintos uniformemente distribuidos en el intervalo entre el máximo y el mínimo de cada serie. Esto les generara cuatro series: E+ S+ R+ y C+.

7. Apliquen el procedimiento que discutimos en clase del artículo de Grosse et al para calcular la información mutua para cada una de sus series E*, S*, R*, C*, E+, S+, R+, C+, para ventanas de longitud k desde 1 hasta [6*Pi/g]+1.

8. Muestren y comenten ampliamente las gráficas de k contra información mutua, comentando las diferencias entre las series * y las +, y comentando las relaciones que vean entre periodicidad y la información mutua. Por supuesto, hagan un resúmen (sin código preferentemente) del procedimiento que aplicaron, poniendo especial atención a los detalles como: ¿qué criterio utilizarón en la frontera de la serie? ¿por qué? ¿qué limitaciones tiene?

9. Investiguen algunas propiedades de la función con la que generaron la serie C, y comenten las relacionen de estas con los resultados de su experimento.

IMPORTANTE:
Si hacen satisfactoriamente lo descrito hasta este momento podrán obtener una calificación en esta tarea de máximo 8. Si quieren obtener una calificación mayor deberán comentar otras cosas, para lo que talvez sea necesario hacer más experimentos. Usen su creatividad y su curiosidad para plantearse y responder (o bosquejar las respuestas a) otras preguntas. Si quieren hacer el experimento con otras series de tiempo son bienvenidos.


Lineamientos:

1. La tarea se entregará por equipos de estrictamente no más de 4 personas. El trabajo se puede hacer entre dos personas, así que el que estén solo 2 o 3 en el equipo no los coloca en desventaja significativa. Esta vez no tendremos nada que ver con la creación de los equipos.

2. Deben entregarla en formato electrónico: .pdf .odt.

3. La fecha límite de entrega es el Jueves 29 de Noviembre antes de la clase. Es importante que respeten esta fecha pues el fin del semestre está cerca y habrá todavía otra tarea.

Nota Importante.

El cálculo de la función de densidad de probabilidad conjunta puede ser computacionalmente costoso, sobretodo para las series +. Una buena alternativa es aproximar esta función partiendo el espacio de valores en cuadraditos de lados más o menos grandes. Si optan por esto, comenten respecto a la precisión que se ha perdido, si es que se pierde.

Por lo anterior, es importante que midan el desempeño de sus algoritmos y su equipo para asegurarse de que terminarán los cómputos a tiempo.

2 comentarios:

Anónimo dijo...

La serie T, como va a ser?

VíctorMireles dijo...

Perdón.
Es la serie C, la que generan con la entrada 4.