Ventor de Cadena de Bici: Funcionamiento Detallado

En el mundo del análisis de datos, la integración de herramientas y lenguajes es crucial para obtener resultados precisos y significativos. Dentro del entorno de Tableau, podemos utilizar R a través de campos calculados y aprovechar los beneficios que brindan las funciones, bibliotecas y paquetes este lenguaje.

Es importante entender el funcionamiento desde el principio, ya que puede constar enfocarlo. Estos cálculos invocan dinámicamente el motor R y pasan valores a través del paquete Rserve (como veremos más adelante), devolviendo así los resultados calculados a Tableau.

Herramientas Necesarias

Normalmente, un analista de negocio (o bien un analista de datos) suele trabajar en local, donde realiza sus operaciones a través de varias herramientas interconectadas a la base de datos, repositorios en Cloud, etc.

  • Tableau Desktop: Obviamente no podemos depender de una versión free, como la Public, así que en el caso de que no tengas la versión de pago, puedes aprovechar el free-trial de 15 días.
  • R Studio: La tool de gestión de R en manera más cómoda, entorno amigable y donde podemos aprovechar al máximo nuestras tareas de minería de datos y análisis. En este punto R Studio se quedará abierto y enviará todas sus informaciones a Tableau. Lógicamente utilizaremos R Studio (la tool con capa visual que para el lenguaje R), para poder crear este vínculo.

Funciones Clave en R

Para integrar R con Tableau, se utilizan funciones específicas que permiten pasar datos y obtener resultados. Aquí hay algunas de las funciones más importantes:

  • SCRIPT_STR: Indica un resultado de cadena de la expresión especificada. La expresión se pasa directamente a una instancia de extensión de análisis en ejecución. En las expresiones R utilizamos .argn (con un punto inicial) para hacer referencia a parámetros (.arg1, .arg2, etc.).
  • SCRIPT_BOOL: Indica un resultado booleano de la expresión especificada. La expresión se pasa directamente a una instancia de extensión de análisis en ejecución. En las expresiones R usamos .argn (con un punto inicial) para hacer referencia a parámetros (.arg1, .arg2, etc.).
  • SCRIPT_REAL: Indica un resultado con un valor numérico real de la expresión especificada. La expresión se pasa directamente a una instancia de extensión de análisis en ejecución. En las expresiones R utilizamos .argn (con un punto inicial) para hacer referencia a parámetros (.arg1, .arg2, etc.).
  • SCRIPT_INT: Indica un número entero como resultado de la expresión especificada. La expresión se pasa directamente a una instancia de extensión de análisis en ejecución. En las expresiones R, .argn (con un punto inicial) para hacer referencia a parámetros (.arg1, .arg2, etc.).

Ejemplos Prácticos

Para estas cuatro funciones utilizaremos las muestras de ejemplo Sample-Superstore.xlsx que viene por defecto en nuestro Tableau. En esta demo veremos el uso más sencillo de esta función: cómo realizar una extracción del campo “name”. Una vez efectuada la conexión en R, abrimos un nuevo proyecto y cargamos el dataset de ejemplo.

Extracción de Subcadenas

La función substr() se utiliza para recuperar o reemplazar una subcadena de una cadena de caracteres. La función ATTR() en Tableau devuelve el valor de la expresión dada si todas las filas del grupo tienen SOLO un valor único; de lo contrario, devuelve un asterisco (*).

Una vez realizada la creación del campo calculado procedemos a utilizarlo en nuestro dashboard.

Búsqueda de Patrones

Con el mismo dataset anterior, en fila añadimos las dimensiones State y City. Si la cadena contiene el patrón, la función grepl devuelve VERDADERO; de lo contrario, devuelve FALSO. Si el parámetro resulta ser un vector de cadena, la función devuelve un vector lógico (VERDADERO si es una coincidencia, de lo contrario FALSO).

Parámetros adicionales de grepl:

  • perl: lógico.
  • fijo: lógico. Si es TRUE, el patrón es una cadena que debe coincidir tal cual.
  • useBytes: lógico.

Podemos utilizar el cuadro de mando anterior, el campo calculado e insertarlo en filtros.

Multirregresión y Parámetros What-If

Para el uso de esta función utilizamos un dataset para realizar multirregression, US-Census, está disponible en este repositorio (es el mismo para descargar el resto de demos realizadas). Haremos uso de parámetros what-if y veamos cómo emplearlo en este ejemplo.

Hay que tener en cuenta que todo (medidas, dimensiones, parámetros, constantes) se pasa como vectores a R. Por ejemplo, nuestro .arg5 es un parámetro que está vinculado al desempleo. Lo estamos usando como .arg5 [1] para leerlo como un valor único / escalar en nuestro cálculo. Puede devolver resultados diferentes.

Tutorial avanzado de Tableau | Pronóstico de tendencias, gráficos avanzados e integración con R | Edureka Rewind

Machine Learning con Dataset Iris

En esta demo utilizaremos el dataset de iris, muy conocido para los amantes de la minería de datos y Machine Learning, disponible en este repositorio. El uso de los campos calculados de Tableau nos ayuda a llevar nuestros informes al siguiente nivel.

Si durante la práctica te sientes perdido es lógico. ¿Has realizado algún cálculo en R y has probado a integrarlo en Tableau? Si es así, puedes comentar en este mismo post y abrir un debate.

tags: #ventor #de #cadena #de #bici