Gabriel Muñoz
Consultor en Datos Biodiversidad y Geoespaciales
Coordinador General
Talleres participativos
Aprender herramientas de manera práctica
22,23 de Marzo.
MediaLAB
Valor agregado
Inversión en tiempo
Inversión en conocimiento
Curación de datos
Human readable —> Machine readable —> Human readable
Desarrollar habilidades
y aprender herramientas…
que ya existe?
Open Databases
Datos heterogeneos, desordenados (“Messy Data”)
Hojas de calculo
Datos heterogeneos, desordenados (“Messy Data”)
Una Variable, Una Columna!!!!
Una Variable, Una Columna!!!!
Pequeños problemas, grandes dolores de cabeza!
Errores de tipeo
Discrepancias
Fueras de lugar
Errores de formato
Irregularidades
Datos faltantes
Pequeños problemas, grandes dolores de cabeza!
Contradicciones
Duplicaciones
Fueras de rango
Incongruencias
Multiples valores
Aprender a usar codigo R tidyr, dplyr
Metadata a nivel del proyecto
Metadata a nivel de variables
Uso de software como R, mantiene la documentación de datos durante el proceso de análisis
Usa codigo (Scripts)
Registros similares en un dataset
Seguir standards internacionales en unidades y formatos (e.g. yyyy-mm-dd)
Se consistente (e.g. Mts, (m), metros)
Preserva en formatos estables (.csv, .txt, TIFF)
Especificar coordenadas espaciales y temporales (e.g. UTM 17S, Geograficas)
RawData as “ReadOnly” y comparte tus scripts
Asegura la calidad de tus datos
Provee Documentación
No te metas con el “raw data”
Bueno:
Malo:
Empieza listas con un 0
de lo contrario
Herramientas
Abiertas
Grátis!
Poderosas
Gran Comunidad Mundial
Actualizables
Desarrollador –> Usuario
Lenguages de programación
plot(speed~dist, cars,
xlab = "distancia",
ylab = "Velocidad",
col = "blue",
pch = 16,
main = "Cars Dataset")
library(plotly)
d <- diamonds[sample(nrow(diamonds), 500), ]
plot_ly(d, x = d$carat, y = d$price,
text = paste("Clarity: ", d$clarity),
mode = "markers", color = d$carat, size = d$carat)
Maarkdown es un lenguaje simple, pero poderoso para crear publicaciones. Facil sintaxis que permite el formato y la inclusión de links, imagenes, referencias, en el texto.
Una ecuación: $A = \sin(x)^2*log(a)+25^{2}$
Esto es código this is code
\(A = \sin(x)^2*log(a)+25^{2}\)
Una imagen: !(figs/copypaste.jpg)
No máss copy - paste!
hypervinculo: [GBIF](http://www.gbif.org/)
Este el es link a la página del GBIF.
R Markdown te permite integrar tu codigo y flujo de analisis con texto escrito en sintaxis markdown. Esto asegura que tus análisis sean reproducibles, interactivos, compartibles y agradables de visualizar al momento de reportar. Al mismo tiempo reduce el tiempo ocupado en escribir y Formatear reporters. Tareas manuales como enumerar figuras, bibliografía, formatos de tablas son ahora automatizadas. Empiezas a escribir el reporte al tiempo que haces tus análisis.
Esta presentación fue hecha en Markdown
Markdown soporta no solo R, pero tambien otros lenguajes
Python:
print 'Hello, world. This is Python:'
import sys
print(sys.version) # Python version
## Hello, world. This is Python:
## 2.7.10 (default, Feb 7 2017, 00:08:15)
## [GCC 4.2.1 Compatible Apple LLVM 8.0.0 (clang-800.0.34)]
R
print("Hello, world. This is R")
## [1] "Hello, world. This is R"
version
## _
## platform x86_64-apple-darwin15.6.0
## arch x86_64
## os darwin15.6.0
## system x86_64, darwin15.6.0
## status
## major 3
## minor 4.3
## year 2017
## month 11
## day 30
## svn rev 73796
## language R
## version.string R version 3.4.3 (2017-11-30)
## nickname Kite-Eating Tree
En resumen:
\[ Markdown + R + Bookdown = Reports (Dynamic + Reliable ) \] 1
https://shiny.rstudio.com/gallery/movie-explorer.html
Espero verlos en los talleres
Gabriel Muñoz
Repositorio de esta presentación:
Reliable in the sense the code is properly written.↩