LISTA DE VERIFICACIÓN PARA UN PORTAFOLIO DE ANALISTA DE DATOS.

 


Por: Rogelio Ernesto De la Cruz Rodriguez.

Analista de Datos Junior

4 de marzo 2025

Santo Domingo República Dominicana

LISTA DE VERIFICACIÓN PARA UN PORTAFOLIO DE ANALISTA DE DATOS.


Introducción

El portafolio de un analista de datos es una herramienta vital para mostrar sus habilidades,

experiencia y logros en el campo del análisis de datos. Un portafolio bien estructurado no solo

refleja las habilidades técnicas del analista, sino también su capacidad para comunicarse

efectivamente y resolver problemas reales.

Este documento proporciona una guía paso a paso sobre cómo crear un portafolio de analista

de datos que destaque entre la competencia y ayude a los profesionales a conseguir el trabajo

deseado.


1. Sección "Acerca de mí".

Breve descripción personal que incluya:

Quién eres y tu experiencia en análisis de datos.

Tus intereses y pasiones en el campo.

Objetivos profesionales y cómo planeas contribuir al sector.

Información de contacto (correo, LinkedIn, etc.) y enlaces a redes sociales profesionales.


2. Proyectos Relevantes.

Incluye proyectos que demuestren tus habilidades en diferentes áreas del análisis de datos:

Limpieza de Datos: Muestra cómo preparar datos crudos para análisis (usando Python, R o

SQL).

Análisis Exploratorio de Datos (EDA): Proyectos que incluyan visualización y resumen de datos

para extraer patrones e insights.

Modelos Predictivos o Machine Learning: Ejemplos donde hayas aplicado algoritmos para

predicción o clasificación.

Análisis Empresarial: Proyectos que conecten los datos con métricas empresariales clave,

mostrando impacto en decisiones estratégicas.

Visualización de Datos: Dashboards interactivos creados con herramientas como Tableau o

Power BI.

Casos del Mundo Real: Análisis aplicados a problemas reales, como estudios de mercado o datos

abiertos relevantes a tu industria.


3. Narrativa y Documentación.

Explica el propósito y contexto de cada proyecto.

Describe las herramientas utilizadas (Python, SQL, Tableau, etc.) y las decisiones tomadas

durante el proceso.

Incluye resultados clave e insights accionables obtenidos.


4. Presentación Atractiva.

Usa plataformas profesionales como GitHub (para proyectos con código), Tableau Public (para

dashboards) o Kaggle (para competencias y análisis).

Considera crear un sitio web personal con un dominio personalizado para mayor

profesionalismo.


5. Diversidad Técnica.

Asegúrate de incluir proyectos que reflejen habilidades variadas:

Extracción y limpieza de datos.

Análisis descriptivo, predictivo y prescriptivo.

Visualización avanzada.

Modelado estadístico o matemático.


6. Habilidades Blandas.

Agrega ejemplos de informes escritos o presentaciones que muestren tus habilidades

comunicativas.

Incluye testimonios o recomendaciones si es posible (de profesores, empleadores o clientes).


7. Actualización Constante.

Mantén tu portafolio actualizado con tus últimos proyectos.

Revisa errores tipográficos y asegúrate de que todos los enlaces funcionen correctamente.


8. Opcional: Blog o Publicaciones.

Escribe sobre tus proyectos, procesos y hallazgos en un blog personal o Medium. Esto refuerza

tu aprendizaje y muestra habilidades de comunicación.

Un portafolio bien estructurado no solo refleja tus habilidades técnicas, sino también tu

capacidad para comunicarte efectivamente y resolver problemas reales.


Referencias

Coursera. (2023, Noviembre 29). Cómo crear un portafolio de analista de datos: Consejos para

el éxito. Coursera.

https://www.coursera.org/mx/articles/how-to-build-a-data-analyst-portfolio


Darkzos. (2023, Enero 16). Ideas para Portafolio de Analista de Datos. reddit.

https://www.reddit.com/r/programacion/comments/10dt6zq/ideas_para_portafolio_de_an

alista_de_datos/?rdt=52887


Datademia (Director). (2023). ¿Cómo crear un portfolio para conseguir trabajo como analista o

científico de datos? [Film]. https://www.youtube.com/watch?v=p_NRtz32Ab4&t=1s


Datademia. (2023, August 27). ¿Cómo crear un portfolio para conseguir trabajo como analista o

científico de datos? Datademia.

https://datademia.es/blog/como-crear-un-portfolio-para-conseguir-trabajo-como-analistao-cientifico-de-datos


DatData. (2024, Noviembre 19). Kit de Herramientas del Analista de datos - datdata. DatData.

https://www.datdata.com/blog/kit-herramientas-analista-de-datos


DatData. (2024, Enero 5). Ruta para ser Analista de datos en 2024. DatData.

https://www.datdata.com/blog/ruta-para-ser-analista-de-datos-en-2024


Durkin, M. (2024, Mayo 14). Crear una cartera de analistas de datos: Todo lo que necesitas

saber. Learn SQL.

https://learnsql.es/blog/crear-una-cartera-de-analistas-de-datos-todo-lo-que-necesitas-sa

ber/


ESEID AI Business School. (n.d.). Cómo crear un portafolio para analista de datos. Introducción

a cómo crear un portafolio para de Analista de Datos. ESEID AI Business School.

https://eseid.org/como-crear-un-portafolio-para-analista-de-datos/


Garaje de Ideas. (2024, Febrero 12). Consejos para crear un Portfolio de Data Analyst que

consiga que te contraten. You Tube.

https://www.youtube.com/watch?v=vYlP1v5er70&t=3s


Garaje de Ideas. (2024, Mayo 20). 5 proyectos que deberías tener Si o Si en tu portfolio de

Data Analyst. You Tube. https://www.youtube.com/watch?v=RZu5NFhAz1g&t=5s


Kousourova, E. (2024, Febrero 21). Cómo ser analista de datos en 2024: 5 pasos para iniciar tu

carrera profesional. DataCamp.

https://www.datacamp.com/es/blog/how-to-become-a-data-analyst


Linkedin. (n.d.). A continuación, te explicamos cómo puedes crear una cartera sólida como

novato en el análisis de datos. Linkedin.

https://www.linkedin.com/advice/1/heres-how-you-can-create-robust-portfolio-novice-o0u

ye?lang=es&lang=es&originalSubdomain=es


Nehme, A. (2024, septiembre 11). Cómo construir una gran cartera de ciencia de datos (con

ejemplos). DataCamp.

https://www.datacamp.com/es/blog/how-to-build-a-great-data-science-portfolio-with-exa

mples


Smart Data. (2023, Octubre 31). Consejos clave para tu 1er portafolio de proyectos. Smart

Data. https://smartdata.com.pe/consejos-para-crear-tu-portafolio-de-proyectos/


Talamona, E. (2023, Septiembre 15). Portfolio de Proyectos como Data Analyst - 5 Ideas de

Proyectos. You Tube. https://www.youtube.com/watch?v=byC2KcCHR28

CASO PRACTICO BELLABEAT TIME

 

CASO DE ESTUDIO BELLABEAT

 

CUADERNO R

 

AUTOR: ROGELIO ERNESTO DE LA CRUZ RODRÍGUEZ

 

 



 

Introducción.

 

Acerca de la empresa.

Bellabeat, una empresa de tecnología para la salud fundada por Urška Sršen y Sando Mur, fabrica productos inteligentes diseñados para el bienestar de la mujer. Sršen, una artista, aportó su experiencia para crear dispositivos elegantes y tecnológicos que puedan educar e inspirar a las mujeres a nivel mundial. Al recopilar datos sobre actividad física, sueño, estrés y salud reproductiva, Bellabeat brinda a las mujeres información sobre sus hábitos y salud. Desde 2013, Bellabeat ha experimentado un rápido crecimiento, estableciéndose como una empresa líder en tecnología para el bienestar de la mujer.

 

 

Tarea empresarial.

 

Bellabeat busca mejorar la competitividad de su reloj inteligente Time en el mercado de wearables de salud y bienestar. Para lograrlo, analizará tendencias clave en el uso de dispositivos inteligentes, identificando oportunidades para incorporar tecnologías avanzadas como inteligencia artificial predictiva, sensores biométricos y telemedicina 5G.

Se priorizarán las necesidades de las usuarias actuales y potenciales, considerando la influencia de la competencia, la viabilidad tecnológica y las expectativas de inversionistas y profesionales de la salud.

Como resultado, se diseñarán estrategias de producto y marketing que impulsen la diferenciación y el posicionamiento de Bellabeat en el sector.

 

PREGUNTAS A CONTESTAR.

 

      ¿Cuáles son algunas tendencias de uso de los dispositivos inteligentes?

 

Monitorización avanzada e IA: Integración de sensores biométricos (glucosa, presión, hidratación, salud mental) y análisis en tiempo real para predecir crisis y personalizar rutinas.

Ejemplos destacados: Relojes que detectan estrés, anillos inteligentes que monitorizan el sueño.

 

Telemedicina 5G: Transmisión instantánea de datos, cirugías remotas y monitoreo domiciliario.

 

Ecosistemas interconectados: Sincronización con hogares inteligentes, historiales clínicos y comunidades virtuales.

 

Bienestar integral: Combinación de meditación, ejercicio, nutrición y alertas proactivas.

 

      ¿Cómo se podrían aplicar estas tendencias a los clientes de Bellabeat?

 

Sensores avanzados: Integrar análisis hormonal (cortisol, estrógeno) y SpO₂ para medir fatiga e hidratación.

   

Telemedicina 5G: Compartir datos en tiempo real con profesionales y emitir alertas automáticas.

 

Ecosistema interconectado: Conectar con dispositivos de glucosa, básculas y apps de nutrición, centralizando la información en un dashboard unificado.

 

Diseño y privacidad: Mantener una estética elegante con optimización de batería y cifrado de datos.

 

      ¿Cómo podrían ayudar estas tendencias a influir en la estrategia de marketing de Bellabeat?

 

Contenido educativo y personalizado: Destacar funciones biométricas avanzadas y explicar datos de salud femenina (p.ej., niveles de cortisol y SpO₂).

 

Colaboraciones y validación experta: Alianzas con ginecólogos, nutricionistas e influencers de salud.

 

Segmentación por etapas vitales: Campañas dirigidas a embarazo, menopausia y condiciones como SOP.

 

Experiencia integrada: Mostrar la interacción del reloj con dispositivos IoT y utilizar realidad aumentada para visualizar datos.

 

Enfoque en bienestar preventivo: Estrategias de marketing basadas en insights personalizados y promoción de la tecnología preventiva para la salud femenina.

 

PREPARACIÓN DE LOS DATOS.

 

Hay que proceder a la preparación de los datos antes de pasar a la etapa de procesamiento, para esto es necesario contestar las siguientes preguntas orientativas:

 

  • ¿Dónde se almacenan los datos?

Los datos están almacenados en la plataforma Kaggle a partir de los “Datos de seguimiento de actividad física de Fitbit” durante el periodo 12 de marzo al 12 de mayo del 2016 y en diversas páginas de internet, de dónde procedí a descargarlos a mi computadora y a Google Drive.

 

·       ¿Cómo están organizados los datos? ¿Están en formato largo o ancho?

Mis datos son archivos .csv y están en formato ancho donde cada número de id representa un usuario diferente y cada columna representa una medición diferente.

 

  • ¿Hay problemas con el sesgo o la credibilidad de estos datos? ¿Los datos son confiables, originales, integrales, actuales y citados (ROCCC)?

o   No hay problemas de sesgo con los datos, ya que los mismos no informan sexo, edad, raza, estatus social ni otros factores que podrían afectar la credibilidad de estos por problemas de discriminación.

o   Son originales e integrales porque se toman de fuentes confiables (usuarios de Fitbit).

o   En cuanto a la actualización, aunque los datos tomados para el analisis datan del año 2016, el tiempo promedio semanal dedicado al ejercicio se mantiene alrededor de las 2 horas semanales en la actualidad.

o   Las fuentes fueron citadas debidamente en formato APA 7ma. Edición.

 

  • ¿Cómo se aborda la autorización, la privacidad, la seguridad y la accesibilidad?

o   No hay problemas de autorización de los datos ya que son CC0: Dominio público, conjunto de datos disponibles a través de Mobius.

o   En cuanto a la privacidad dichos datos fueron proporcionados de manera anónima y consentida por usuarios de Fitbit.

o   Los datos se encuentran disponibles en Google Sites de manera pública.

 

  • ¿Cómo verificar la integridad de los datos?

En el transcurso de este trabajo se describe el proceso de limpieza de los datos, garantizando su integridad.

 

  • ¿Existe algún problema con los datos?

No.


Fuentes de los datos.

 

Durante el desarrollo del contexto de este trabajo y con los fines de encontrar información actualizada de las tendencias mundiales sobre el uso de dispositivos de seguimiento de la actividad física y de salud de la sociedad actual nos auxiliamos de las siguientes fuentes:

 

 

      Average hours per day spent in selected leisure and sports activities by age. (n.d.). Bureau of Labor Statistics. https://www.bls.gov/charts/american-time-use/activity-leisure.htm

      Bellabeat Introduces Time. (2018, Diciembre 6). BioSpace. https://www.biospace.com/bellabeat-introduces-time

      Bellabeat. (n.d.). About Time. Bellabeat.com. https://support.bellabeat.com/hc/en-us/articles/360002118979-Introduction

      BELLABEAT - TIME Smartwatch (Silver) – The Wearables Store. (n.d.). The Wearables Store. https://www.thewearablesstore.com/products/bellabeat-time-smartwatch-silver

      Duffin, M. (2024, Junio 21). How to Improve Your Fitness with Biometric Wearables. Rare Connections. https://rareconnections.io/biometric-wearables/

      Ganesh, S. (2024, Agosto 3). AI Innovations in Smart Watches: Beyond Fitness Tracking Explore how AI innovations in smartwatches are revolutionizing wearable technology. Inside Technology. https://www.analyticsinsight.net/artificial-intelligence/ai-innovations-in-smart-watches-beyond-fitness-tracking

      Garza. (2025, Enero 18). Las 5 tendencias en tecnología para el hogar inteligente en 2025. Garza. https://garza.es/blogs/noticias/las-5-tendencias-en-tecnologia-para-el-hogar-inteligente-en-2025

      Informa Markets. (2025, Enero 6). Telemedicina 2.0: Cómo el 5G y los wearables revolucionarán la salud en 2025. Expomedia Hub. https://www.expomedhub.com/nota/innovacion/5g-y-wearables-revolucionaran-la-salud-en-2025

      Irwin, S., & Australian Institute of Fitness. (2024, Marzo 20). Harnessing the Power of Wearable Technology: How Fitness Trackers and Smartwatches Improve Your Workouts. The Fitness Zone. https://fitness.edu.au/the-fitness-zone/harnessing-the-power-of-wearable-technology-how-fitness-trackers-and-smartwatches-improve-your-workouts/

      Luzhetska, O. (2022). Bellabeat Case Study: R Notebook. Kaggle. https://www.kaggle.com/code/olgaluzhetska/bellabeat-case-study-r-notebook

      Mazur, B. (2023, Noviembre 28). Wearable biometric devices: A new frontier in healthcare product development. Ignitec. https://www.ignitec.com/insights/wearable-biometric-devices-a-new-frontier-in-healthcare-product-development/

      Perez, S. (2018, Diciembre 21). Bellabeat’s new hybrid smartwatch tracks your stress…and goes with your outfit. TechCrunch. https://techcrunch.com/2018/12/21/bellabeats-new-hybrid-smartwatch-tracks-your-stress-and-goes-with-your-outfit/

      Periodico El Caribe. (2025, Enero 13). El 2025 es el año de la salud mental. El Caribe. https://www.elcaribe.com.do/gente/tecnologia/el-2025-es-el-ano-de-la-salud-mental/

      Qualud. (2025, Enero 14). Las tendencias de salud digital que marcarán 2025. Qualud. https://www.qualud.com/en/blog/las-tendencias-de-salud-digital-que-marcaran-2025

 

      Reid, M. (n.d.). Women's Biometrics: Harnessing the Potential of Gender-Specific Health & Wellness Data. Evie. https://eviering.com/blogs/news/gender-specific-data-for-womens-health-biometrics

      Simbex. (n.d.). AI-Driven Personalization in Wearable Medical Devices: The Future of Patient Care. Simbex. https://simbex.com/ai-driven-personalization-in-wearable-medical-devices-the-future-of-patient-care/

      T, C. (2024, Abril 22). Tecnología Wearable en el Bienestar. Cdetech. https://cdetech.org/tecnologia-wearable-en-el-bienestar/

 

Los datos utilizados con fines de análisis se tomaron de la siguiente fuente: 

      Mobius. (2024). FitBit Fitness Tracker Data. Kaggle. https://www.kaggle.com/datasets/arashnic/fitbit

  

Herramientas e instrumentos.

 

Cuaderno de R es la principal herramienta utilizada para el procesamiento, análisis, presentación y visualización de los datos debido a su facilidad de uso y potencia de procesamiento.

 

Estructura y organización de los datos.

 

Los datos consisten en 25 archivos .csv, 22 en formato ancho y 3 en formato largo.

Se recaban en intervalos de tiempo variables, abarcando desde segundos hasta días, y abarcan una amplia gama de indicadores, tales como:

 

      Actividad física: Nivel de ejercicio, tipo de actividad realizada, duración, etc.

      Sueño: Horas de sueño, calidad del sueño, fases del sueño, etc.

      Peso: Medición del peso corporal, variaciones a lo largo del tiempo.

      MET (equivalente metabólico de la tarea): Estimación del gasto energético durante las actividades.

      Ingesta calórica: Cantidad de calorías consumidas a través de la alimentación.

      Frecuencia cardíaca: Ritmo cardíaco en reposo y durante la actividad física.

 

 

PROCESAMIENTO DE LOS DATOS.

 

Selección de archivos de entrada.

 

Este análisis se enfocará en los archivos 'Pasos_por_hora' y 'Calorias_por_hora' provenientes de los datos de seguimiento de actividad física de Fitbit. La elección de estos archivos se fundamenta en su capacidad para proporcionar una visión detallada de la relación entre la actividad física medida en pasos por hora y el consumo calórico por hora. Al correlacionar estas dos variables, se busca obtener información valiosa para optimizar el reloj Time® de Bellabeat®.

 

Ventajas de utilizar estos archivos como fuentes de datos:

 

     Precisión y Detalle: Los datos de Fitbit son conocidos por su precisión en el seguimiento de la actividad física y el consumo calórico. Los archivos 'Pasos_por_hora' y 'Calorias_por_hora' ofrecen un registro detallado de estas métricas, lo que permite un análisis profundo y fiable.

 

     Correlación Directa: La combinación de estos dos archivos permite establecer una correlación directa entre la actividad física y el consumo calórico. Esta relación es fundamental para entender cómo la actividad influye en el gasto energético y para personalizar las recomendaciones del reloj Time® de Bellabeat®.

 

     Identificación de Patrones: El análisis de estos datos permite identificar patrones de actividad y consumo calórico a lo largo del día. Esto puede revelar información valiosa sobre los momentos de mayor y menor actividad, así como sobre los períodos de mayor y menor consumo calórico.

 

     Base para Mejoras: La información obtenida de este análisis servirá como base para sugerir mejoras específicas al reloj Time® de Bellabeat®. Estas mejoras podrían incluir la optimización de los algoritmos de seguimiento de actividad y consumo calórico, así como la personalización de las recomendaciones para los usuarios.

 

 

Luego de descargados los archivos 4 archivos 'Pasos_por_hora' y 'Calorias_por_hora' de los periodos 12 de marzo al 11 de abril y 12 de abril al 12 de mayo en formato csv, se procedió a subirlos a la plataforma R Posit Cloud


  1. Instalar paquete “tidyverse”:

> install.packages("tidyverse")

 

  1. Cargar las librerias necesarias:

> library(tidyverse)

── Attaching core tidyverse packages ──────────────────────────────────────────── tidyverse 2.0.0 ──

dplyr     1.1.4     readr     2.1.5

forcats   1.0.0     stringr   1.5.1

ggplot2   3.5.1     tibble    3.2.1

lubridate 1.9.4     tidyr     1.3.1

purrr     1.0.4    

── Conflicts ────────────────────────────────────────────────────────────── tidyverse_conflicts() ──

dplyr::filter() masks stats::filter()

dplyr::lag()    masks stats::lag()

ℹ Use the conflicted package to force all conflicts to become errors

> 

3.     Importar las bases de datos:

Presionar el boton New Folder en el workspace de Posit Cloud, nombramos el nuevo folder “Caso práctico Bellabeat Time” e importamos los archivos "Calorias_por_hora_12_marzo_al_11_abril_2016.csv", "Calorias_por_hora_12_abril_12_mayo_2016.csv", “Pasos_por_hora_12_marzo_al_11_abril_2016.csv” y “Pasos_por_hora_12_abril_12_mayo_2016”

 

4.     Verificar la ubicación del archivo:

> getwd()

[1] "/cloud/project"

 

5.     Cambiar la ubicación del archivo:

> setwd("/cloud/project/Caso practico Bellabeat Time")

 

6.     Cargar los archivos csv:

> calorias1 <- read.csv("Calorias_por_hora_12_marzo_al_11_abril_2016.csv")

> calorias2 <- read.csv("Calorias_por_hora_12_abril_12_mayo_2016.csv")

> pasos1 <- read.csv("Pasos_por_hora_12_marzo_al_11_abril_2016.csv")

> pasos2 <- read.csv("Pasos_por_hora_12_abril_12_mayo_2016.csv")

 

7.     Ver las primeras filas de cada dataframe:

 

Uso head() para ver las primeras 10 filas

> head(calorias1, 10)

           Id          ActivityHour Calories

1  1503960366 3/12/2016 12:00:00 AM       48

2  1503960366  3/12/2016 1:00:00 AM       48

3  1503960366  3/12/2016 2:00:00 AM       48

4  1503960366  3/12/2016 3:00:00 AM       48

5  1503960366  3/12/2016 4:00:00 AM       48

6  1503960366  3/12/2016 5:00:00 AM       48

7  1503960366  3/12/2016 6:00:00 AM       48

8  1503960366  3/12/2016 7:00:00 AM       48

9  1503960366  3/12/2016 8:00:00 AM       48

10 1503960366  3/12/2016 9:00:00 AM       49

 

> head(calorias2, 10)

           Id          ActivityHour Calories

1  1503960366 4/12/2016 12:00:00 AM       81

2  1503960366  4/12/2016 1:00:00 AM       61

3  1503960366  4/12/2016 2:00:00 AM       59

4  1503960366  4/12/2016 3:00:00 AM       47

5  1503960366  4/12/2016 4:00:00 AM       48

6  1503960366  4/12/2016 5:00:00 AM       48

7  1503960366  4/12/2016 6:00:00 AM       48

8  1503960366  4/12/2016 7:00:00 AM       47

9  1503960366  4/12/2016 8:00:00 AM       68

10 1503960366  4/12/2016 9:00:00 AM      141

 

> head(pasos1, 10)

           Id          ActivityHour StepTotal

1  1503960366 3/12/2016 12:00:00 AM         0

2  1503960366  3/12/2016 1:00:00 AM         0

3  1503960366  3/12/2016 2:00:00 AM         0

4  1503960366  3/12/2016 3:00:00 AM         0

5  1503960366  3/12/2016 4:00:00 AM         0

6  1503960366  3/12/2016 5:00:00 AM         0

7  1503960366  3/12/2016 6:00:00 AM         0

8  1503960366  3/12/2016 7:00:00 AM         0

9  1503960366  3/12/2016 8:00:00 AM         0

10 1503960366  3/12/2016 9:00:00 AM         8

 

> head(pasos2, 10)

           Id          ActivityHour StepTotal

1  1503960366 4/12/2016 12:00:00 AM       373

2  1503960366  4/12/2016 1:00:00 AM       160

3  1503960366  4/12/2016 2:00:00 AM       151

4  1503960366  4/12/2016 3:00:00 AM         0

5  1503960366  4/12/2016 4:00:00 AM         0

6  1503960366  4/12/2016 5:00:00 AM         0

7  1503960366  4/12/2016 6:00:00 AM         0

8  1503960366  4/12/2016 7:00:00 AM         0

9  1503960366  4/12/2016 8:00:00 AM       250

10 1503960366  4/12/2016 9:00:00 AM      1864

 

8.     Verificando la estructura del dataframe

Primero, revisamos el tipo de dato de las columnas usando str():

> str(calorias1)

'data.frame':   24084 obs. of  3 variables:

 $ Id          : num  1.5e+09 1.5e+09 1.5e+09 1.5e+09 1.5e+09 ...

 $ ActivityHour: chr  "3/12/2016 12:00:00 AM" "3/12/2016 1:00:00 AM" "3/12/2016 2:00:00 AM" "3/12/2016 3:00:00 AM" ...

 $ Calories    : int  48 48 48 48 48 48 48 48 48 49 ...

 

> str(calorias2)

'data.frame':   22099 obs. of  3 variables:

 $ Id          : num  1.5e+09 1.5e+09 1.5e+09 1.5e+09 1.5e+09 ...

 $ ActivityHour: chr  "4/12/2016 12:00:00 AM" "4/12/2016 1:00:00 AM" "4/12/2016 2:00:00 AM" "4/12/2016 3:00:00 AM" ...

 $ Calories    : int  81 61 59 47 48 48 48 47 68 141 ...

 

> str(pasos1)

'data.frame':   24084 obs. of  3 variables:

 $ Id          : num  1.5e+09 1.5e+09 1.5e+09 1.5e+09 1.5e+09 ...

 $ ActivityHour: chr  "3/12/2016 12:00:00 AM" "3/12/2016 1:00:00 AM" "3/12/2016 2:00:00 AM" "3/12/2016 3:00:00 AM" ...

 $ StepTotal   : int  0 0 0 0 0 0 0 0 0 8 ...

 

> str(pasos2)

'data.frame':   22099 obs. of  3 variables:

 $ Id          : num  1.5e+09 1.5e+09 1.5e+09 1.5e+09 1.5e+09 ...

 $ ActivityHour: chr  "4/12/2016 12:00:00 AM" "4/12/2016 1:00:00 AM" "4/12/2016 2:00:00 AM" "4/12/2016 3:00:00 AM" ...

 $ StepTotal   : int  373 160 151 0 0 0 0 0 250 1864 ...

 

Vemos que el formato de la columna ActivityHour es “chr”, o sea “character" por lo que hay que convertirla a formato de fecha y hora.

 

9.     Convirtiendo la columna ActivityHour a formato POSIXct:

> calorias1$ActivityHour <- as.POSIXct(calorias1$ActivityHour, format = "%m/%d/%Y %I:%M:%S %p", tz = "UTC")

> calorias2$ActivityHour <- as.POSIXct(calorias2$ActivityHour, format = "%m/%d/%Y %I:%M:%S %p", tz = "UTC")

> pasos1$ActivityHour <- as.POSIXct(pasos1$ActivityHour, format = "%m/%d/%Y %I:%M:%S %p", tz = "UTC")

> pasos2$ActivityHour <- as.POSIXct(pasos2$ActivityHour, format = "%m/%d/%Y %I:%M:%S %p", tz = "UTC")

 

10.  Ver si existen filas con valores faltantes:

> calorias1[!complete.cases(calorias1), ]

[1] Id           ActivityHour Calories   

<0 rows> (or 0-length row.names)

 

 

> calorias2[!complete.cases(calorias2), ]

[1] Id           ActivityHour Calories   

<0 rows> (or 0-length row.names)

>

> pasos1[!complete.cases(pasos1), ]

[1] Id           ActivityHour StepTotal  

<0 rows> (or 0-length row.names)

>

> pasos2[!complete.cases(pasos2), ]

[1] Id           ActivityHour StepTotal  

<0 rows> (or 0-length row.names)

 

El resultado “<0 rows> (or 0-length row.names)”  indica que no existen valores faltantes en los datos.

 

11.  Analisis de valores atípicos:

> summary(calorias1)

       Id             ActivityHour                      Calories    

 Min.   :1.504e+09   Min.   :2016-03-12 00:00:00.0   Min.   : 42.00 

 1st Qu.:2.347e+09   1st Qu.:2016-03-19 14:00:00.0   1st Qu.: 61.00 

 Median :4.559e+09   Median :2016-03-27 04:00:00.0   Median : 77.00 

 Mean   :4.889e+09   Mean   :2016-03-27 05:47:23.2   Mean   : 94.27 

 3rd Qu.:6.962e+09   3rd Qu.:2016-04-03 20:00:00.0   3rd Qu.:104.00 

 Max.   :8.878e+09   Max.   :2016-04-12 10:00:00.0   Max.   :933.00

 

> summary(calorias2)

       Id             ActivityHour                       Calories    

 Min.   :1.504e+09   Min.   :2016-04-12 00:00:00.00   Min.   : 42.00 

 1st Qu.:2.320e+09   1st Qu.:2016-04-19 01:00:00.00   1st Qu.: 63.00 

 Median :4.445e+09   Median :2016-04-26 06:00:00.00   Median : 83.00 

 Mean   :4.848e+09   Mean   :2016-04-26 11:46:42.58   Mean   : 97.39 

 3rd Qu.:6.962e+09   3rd Qu.:2016-05-03 19:00:00.00   3rd Qu.:108.00 

 Max.   :8.878e+09   Max.   :2016-05-12 15:00:00.00   Max.   :948.00

 

> summary(pasos1)

       Id             ActivityHour                     StepTotal     

 Min.   :1.504e+09   Min.   :2016-03-12 00:00:00.0   Min.   :    0.0 

 1st Qu.:2.347e+09   1st Qu.:2016-03-19 14:00:00.0   1st Qu.:    0.0 

 Median :4.559e+09   Median :2016-03-27 04:00:00.0   Median :   10.0 

 Mean   :4.889e+09   Mean   :2016-03-27 05:47:23.2   Mean   :  286.2 

 3rd Qu.:6.962e+09   3rd Qu.:2016-04-03 20:00:00.0   3rd Qu.:  289.0 

 Max.   :8.878e+09   Max.   :2016-04-12 10:00:00.0   Max.   :10565.0 

 

> summary(pasos2)

       Id             ActivityHour                      StepTotal     

 Min.   :1.504e+09   Min.   :2016-04-12 00:00:00.00   Min.   :    0.0 

 1st Qu.:2.320e+09   1st Qu.:2016-04-19 01:00:00.00   1st Qu.:    0.0 

 Median :4.445e+09   Median :2016-04-26 06:00:00.00   Median :   40.0 

 Mean   :4.848e+09   Mean   :2016-04-26 11:46:42.58   Mean   :  320.2 

 3rd Qu.:6.962e+09   3rd Qu.:2016-05-03 19:00:00.00   3rd Qu.:  357.0 

 Max.   :8.878e+09   Max.   :2016-05-12 15:00:00.00   Max.   :10554.0

 

Podemos ver que, aunque se encuentran valores atípicos en las calorías quemadas, los mismos estan relacionados con aumentos en las cantidades de pasos durante la fecha y hora de dicha actividad.

 

12.  Combinar los datos:

Fusionando los datos calorías por hora y pasos por hora respectivamente para formar el intervalo de fechas 12 de marzo al 12 de mayo del 2016.

> datos_combinados_calorias_por_hora <- rbind(calorias1, calorias2)

> datos_combinados_pasos_por_hora <- rbind(pasos1, pasos2)

 

13.  Guardar los datos combinados:

> write.csv(datos_combinados_calorias_por_hora, "archivo_combinado.csv", row.names = FALSE)

> write.csv(datos_combinados_pasos_por_hora, "archivo_combinado_pasos_por_hora.csv", row.names = FALSE)

 

14.  Renombrar el archivo combinado:

 

Click en la casilla para seleccionar el archivo y luego click en el botón Rename en la parte derecha central del Workspace de "archivo_combinado.csv" a “archivo_combinado_calorias_por_hora_12_marzo_12_mayo_2016.csv” y “archivo_combinado_pasos_por_hora.csv” a “archivo_combinado_pasos_por_hora_12_marzo_12_mayo_2016.csv”

 

 

ANALISIS DE LOS DATOS.

 

 

15.  Analizar la correlación entre los datasets "archivo_combinado_calorias_por_hora_12_marzo_12_mayo_2016.csv" y "archivo_combinado_pasos_por_hora_12_marzo_12_mayo_2016.csv:

Cargando librerías necesarias:

>library(ggplot2)

 

Cargando los datos:

>df_calories <- read.csv("archivo_combinado_calorias_por_hora_12_marzo_12_mayo_2016.csv")

df_steps <- read.csv("archivo_combinado_pasos_por_hora_12_marzo_12_mayo_2016.csv")

 

Fusionando los datasets por Id y ActivityHour:

> df_combinado <- merge(df_calorias, df_pasos, by = c("Id", "ActivityHour"))

 

Calculando la correlación:

> correlation <- cor(df_combinado$Calories, df_combinado$StepTotal)

> print(paste("Correlación entre calorías y pasos:", round(correlation, 3)))

[1] "Correlación entre calorías y pasos: 0.818"

 

Visualizando la relación entre pasos y calorías:

> plot <- ggplot(df_combinado, aes(x = StepTotal, y = Calories)) +

+ geom_point(alpha = 0.5, color = "blue") +

+     geom_smooth(method = "lm", color = "red", se = FALSE) +

+     labs(title = "Relación entre pasos y calorías",

+          x = "Pasos por hora",

+          y = "Calorías quemadas por hora") +

+     theme_minimal()

>

> print(plot)

`geom_smooth()` using formula = 'y ~ x'

 

 

La correlación positiva entre el número de pasos y las calorías quemadas por hora sugiere que caminar más pasos se asocia con un mayor gasto calórico. Esto es coherente con estudios que indican que, en promedio, se queman entre 30 y 40 calorías por cada 1,000 pasos dados

Consideraciones adicionales:

    Factores individuales: El gasto calórico puede variar según el peso, la edad, el género y la intensidad de la actividad.

    Precisión de los dispositivos: La exactitud en la medición de pasos y calorías puede variar según el dispositivo utilizado.

 

    Tipo de actividad: No todas las actividades físicas se reflejan únicamente en el conteo de pasos; ejercicios como el ciclismo o el levantamiento de pesas también contribuyen al gasto calórico.

 

 

 

 

 

 

 

 

 

 

 

 

 

COMPARTIR.

 


 

 

 

Puntos claves.

 

       Los datos revelan que estos individuos son proactivos en mantener un nivel de actividad física que se refleja en un mayor gasto calórico, lo que refuerza la utilidad de los dispositivos de monitoreo de salud para fomentar y medir hábitos de vida saludables.

       La correlación entre las calorías quemadas por hora y la cantidad de pasos por hora es de 0.818, lo que indica una relación positiva fuerte. Esto sugiere que, a mayor cantidad de pasos dados, mayor es la cantidad de calorías quemadas.


1. Tendencias en el Uso de Dispositivos Inteligentes en Salud y Bienestar

 

       Monitorización Continua y Precisa:

Los dispositivos modernos permiten un seguimiento en tiempo real de la actividad física, el sueño, el estrés y otros parámetros vitales. La evidencia de correlación entre actividad y calorías refuerza la importancia de contar con datos precisos para tomar decisiones de salud.

 

       Personalización a través del Análisis de Datos:

La integración de algoritmos de inteligencia artificial y machine learning permite ofrecer recomendaciones personalizadas basadas en el comportamiento y necesidades individuales.

       Integración Estética y Funcional en el Estilo de Vida:

Los usuarios buscan dispositivos que no solo sean funcionales, sino que también se integren a su estilo de vida y reflejan una imagen personal atractiva. La moda y la salud van de la mano, especialmente en el público objetivo de dispositivos wearables.

 

       Enfoque en el Bienestar Integral:

La tendencia actual abarca el seguimiento no solo de la actividad física, sino también del sueño, la salud mental y otros aspectos del bienestar. Esto promueve un enfoque holístico para la mejora de la calidad de vida.

 

       Conectividad y Ecosistema Digital:

La sincronización entre dispositivos (wearables, smartphones, aplicaciones de salud) permite un análisis global del bienestar, creando un ecosistema integrado.

 

       Privacidad y Seguridad de los Datos:

Con la creciente preocupación por la protección de la información personal, es crucial garantizar altos estándares de seguridad y transparencia en el manejo de datos sensibles.

 

 

2. Aplicación de las Tendencias al Reloj Inteligente Time de Bellabeat

 

       Recomendaciones Personalizadas:

Utilizando análisis de datos y algoritmos de inteligencia artificial, el dispositivo puede ofrecer sugerencias personalizadas para mejorar la salud y alcanzar metas específicas, aprovechando la relación directa entre actividad y quema de calorías.

 

       Diseño y Estética:

Bellabeat se distingue por sus productos con diseño elegante y sofisticado. El reloj Time debe seguir reforzando este aspecto, siendo un accesorio de moda que se integre perfectamente al estilo de vida del usuario, especialmente del público femenino.

 

       Ecosistema Digital:

La interoperabilidad con otros dispositivos y apps potenciará el valor añadido del producto.

 

       Seguridad y Confianza:

Asegurar y comunicar claramente la política de privacidad y la seguridad de los datos recopilados será un pilar fundamental para ganar la confianza del usuario.

 

3. Estrategias de Marketing para Mejorar la Competitividad y Diferenciación

 

       Comunicación de Personalización y Datos Relevantes:

Mensaje: “Tu salud, tus datos, tus recomendaciones”.

Acción: Mostrar ejemplos reales y testimonios de usuarios que han mejorado su bienestar gracias a las recomendaciones personalizadas derivadas del análisis de sus datos.

 

       Campañas de Bienestar Integral:

Mensaje: “No se trata solo de contar pasos; se trata de transformar tu vida”.

Acción: Desarrollar campañas que integren consejos de salud, nutrición, ejercicio y manejo del estrés, vinculando estas áreas a las funcionalidades del reloj Time.

 

       Diferenciación a través del Diseño:

Mensaje: “El reloj que complementa tu estilo y potencia tu salud”.

Acción: Resaltar el diseño elegante y moderno del reloj en campañas visuales, colaborando con influencers del mundo de la moda y el bienestar.

 

       Creación de Comunidad y Experiencia Compartida:

Mensaje: “Únete a una comunidad de bienestar”.

Acción: Fomentar la creación de una comunidad online donde los usuarios puedan compartir sus logros, retos y consejos, generando una red de apoyo y fidelización.

 

 

       Transparencia en la Seguridad de Datos:

Mensaje: “Tu privacidad es nuestra prioridad”.

Acción: Implementar y comunicar políticas robustas de seguridad, ofreciendo certificaciones o testimonios que respaldan el compromiso de la marca con la protección de la información personal.

 

       Eventos y Demostraciones en Vivo:

Mensaje: “Experimenta el futuro del bienestar hoy”.

Acción: Organizar eventos y demostraciones en tiendas y ferias de salud donde los potenciales clientes puedan probar el dispositivo y ver de primera mano sus beneficios.

 

 

CONCLUSIÓN.

 

El relojTime de Bellabeat se posiciona como una herramienta esencial para un estilo de vida saludable y moderno.

La estrategia de marketing debe resaltar no solo la funcionalidad, sino también el diseño y la experiencia de usuario excepcional.

La seguridad y privacidad de los datos se presentan como pilares para generar confianza en los consumidores.

En conclusión, el proceso analítico detallado respalda una propuesta de valor diferenciada y estratégica en el mercado.

 

Sugerencias de mejora del reloj Time de Bellabeat.

 

A continuación, se presenta una lista de funciones que podrían agregarse al reloj Time de Bellabeat, aprovechando la correlación entre actividad y gasto calórico y las tendencias actuales en dispositivos de salud y bienestar:

 

  1. Seguimiento Integral del Bienestar.

       Reportes holísticos que permitan al usuario conocer su estado de salud general y recibir recomendaciones integrales.

 

  1. Integración con Ecosistema Digital y Conectividad.

       Sincronización fluida con smartphones, aplicaciones de salud y otros dispositivos wearables para un análisis global del bienestar.

       Interoperabilidad que facilite compartir datos con plataformas de salud o incluso con profesionales médicos, siempre respetando la privacidad del usuario.

 

  1. Personalización y Diseño Estético.

       Opciones de personalización de la interfaz y de las carátulas del reloj, permitiendo adaptar el dispositivo al estilo personal del usuario.

 

  1. Análisis Avanzado de Datos y Retroalimentación.

       Utilización de algoritmos de machine learning para identificar patrones en el comportamiento del usuario, como la fuerte correlación entre pasos y calorías, y ajustar las recomendaciones en función de dichos patrones.

       Generación de informes semanales o mensuales que destaquen logros, áreas de mejora y sugerencias personalizadas para optimizar el rendimiento físico.

 

  1. Funciones de Notificaciones Inteligentes.

       Notificaciones que integren datos del entorno (por ejemplo, condiciones climáticas) para planificar mejor las actividades al aire libre.

 

  1. Seguridad y Privacidad de los Datos.

       Implementación de protocolos robustos de encriptación y autenticación biométrica para proteger la información personal.

       Transparencia en la política de privacidad y opciones para que el usuario controle el uso y la compartición de sus datos.

 

Estas funciones no solo potenciarían la utilidad del reloj Time, sino que también contribuirían a fomentar hábitos de vida saludables, integrándose de manera armónica tanto en el ecosistema digital como en el estilo de vida moderno y estético de su público objetivo.

 

 

Rogelio Ernesto De la Cruz Rodríguez

2 de marzo de 2025

El Informe Sin Humo: La Caída del Muro de Silicon Valley y el Factor DeepSeek

El Informe Sin Humo: La Caída del Muro de Silicon Valley y el Factor DeepSeek Por: Rogelio E. De la Cruz R. | IA Sin Humo Santo Domingo,...