Introducción a Inteligencia Artificial | 2.6 - Práctica 1: hello world Machine Learning. (Parte 2)

Javier Cóndor@javiercondor

Hola que tal comunidad, en el video 1 pusieron un link para descargar el archivo train.csv, pero encontré otros 3 que aparte tenían el test.csv, acá les paso uno que aparte tiene un notebook: https://www.kaggle.com/code/startupsci/titanic-data-science-solutions/input

Sobre el error: df_cleaned["Age"] = df_categorized.dropna(axis = 1) Supuestamente lo que quiere es eliminar las filas vacías, eso se lograría con dropna(axis=0) y también pensé reemplazar el código con eso y sin poner ["Age"], pero esto eliminaría todas las filas y la cantidad de filas que tiene la profesora es la misma = 891, que se ve en el grafico por el minuto 01:32. No sé qué devolvía antes dropna(axis=1), pero ahora devuelve todo el data frame sin las columnas con NaN (es decir "Age"), y eso no tiene mucha lógica igualarlo a una sola columna del data frame, por eso da error. Pero por el minuto 02:58 del video la profesora muestra el head y tail del df_cleaned, se observa que tiene la columna "Age" pero con otros valores y aparentemente todos 0 y 1. En un primer momento pensé que serían 0 a los nulos y 1 a los que si tienen valores, pero haciendo un comparativo se obtiene: Age(antes) / Age (después) 22 / 0 38 / 1 26 / 1 NaN / 0 26 / 1 32 / 0 No le encuentro relación, así que lo que haré será buscar nulos, ponerle 0, a los valores que coincidan con esta tablita les pongo ese valor y al resto le pondré 1, a ver que sale. Saludos.


Escribe una respuesta