Filtros

FILTROS:

Índice de la página:
Generales.
De una Tabla ver los primeros y últimos.
iloc.
loc.



------------------------------------------------------------------------------- 
Generales:
df.shape  # Nos da el número de filas y de columnas
df[df.Date == '2009.01.05']  # De la columna Date los de 2009.01.05
df[df.A == 'A-10']  # De la columna A los de A-10
df[(df['A'] == 'A-10') & (df['Volume'] > 100000)]  # Los A=A-10 y Volume>100000
df[df.Date >= '2009.01.05']  # De la columna Date los mayores o iguales a 2009.01.05
df[(df.Date >= '2009.01.05') & (df.Date <= '2009.01.09')]  # Los que estan entre las 2 fechas
df[df.Item.isin(['NZDUSD', 'EURUSD', 'EURCAD'])]  # Ver de la columna 'Item' los que contengan el filtro
df = df[(df['Type'] == 'buy') & (df['Item'] == 'EURUSD')]  # Ver operaciones de compra del EURUSD

x = df[df['dd_start'].isnull()]  # Valores nulos de la columna 'dd_start'
x = df[df['dd_start'].notnull()]  # Valores NO nulos (buenos) de la columna 'dd_start'
df[pd.isna(df['Item'])]  # Ver de la columna 'Item' los que no tengan ningún valor

df[-1:]  # Vemos la ultima fila.
df.head(7)  # Vemos los 7 primeros registros de df
df.tail(7)  # Vemos los 7 últimos registros de df
pd.unique(df['A'])  # Vemos todo lo que hay en la columna 'A' sin ninguna repeticion.

df[dfA.isnull().any(1)]  # Vemos las filas que tienen valores nulos de todo el df
df.dropna()  # Elimina las filas que tengan valores nulos
df.dropna(subset= ['Profit'], axis=0)  # Elimina de la columna Profit las filas con datos nulos
df.dropna()  # Elimina en todo el DataFrame todas las filas con datos nulos, o sea solo veremos los datos buenos
df.fillna(df.mean())  # Rellenar los valores nulos con la media de todo su grupo (columna)
df.fillna(0)  # Rellena los valores nulos con ceros. Podemos poner un string y rellenarlo con cualquier palabra
df.isnull().any()  # Vemos en que columnas se encuentran los valores nulos
df.isnull().sum()  # Vemos cuantos nulos hay en cada columna

df[df['Item'].str.contains('CAD')]  # Vemos los que en la columna 'Item' tengan la palabra CAD
df['Item'].str.lower()  # Pone toda la columna 'Item' en minúsculas

df['Item'].str.upper()  # Pone toda la columna 'Item' en mayúsculas

----------------------------------------------------------------

De una tabla ver los primeros y los últimos registros:
# SE PONE AL PRINCIPIO DONDE VAN LAS IMPORTACIONES 
pd.set_option('display.max_rows', 10)  # Se ven 5 primeros y 5 finales
pd.reset_option('display.max_rows')  # Quita el que se vean los 5 y 5 y se ve toda la tabla



----------------------------------------------------------------


iloc:
# FILTROS CON iloc SELECCIONA FILAS Y COLUMNAS POR INDICE NUMERICO 
iloc[0:5] # Ver las 5 primeras filas
iloc[[0,4,7,10,25]]  # Ver filas salteadas
iloc[:,1:4]  # Ver columnas contiguas
iloc[:,[1,3,5,9]]  # Ver columnas alternas
iloc[[0,3,6,8],[2,4,6,9]]  # Ver filas y columnas alternas
iloc[0:5,3:6]  # Ver rango de filas y columnas
iloc[2,7] = 'A-3-A'  # Sustituir valor de una fila y columna concreta
df.iloc[1234]  # Selecciona la fila número 1234





----------------------------------------------------------------


loc:
# FILTROS CON loc POR NOMBRE DE COLUMNA
loc[:,['Time']]  # Ver una sola columna
loc[:,['Time','Low','Volume']]  # Ver varias columnas alternas o continuas

# HAY QUE PONERLE EL NOMBRE DEL INDICE POR EL QUE QUERAMOS FILTRAR
df.index = df['Date']  # Le ponemos la columna 'Date' como indice
df.loc[16291755]  # Seleccionamos el registro cuyo ticket es 16291755
df.loc['2009.01.02']  # Buscamos un valor (fecha 2009.01.02)
df.loc[['2009.01.02', '2009.01.05', '2009.01.07']]  # Buscamos 3 valores pero podemos buscar todos los necesarios.
df.loc[14166028:15230356][['Open_Price','Close_Price','Profit']]  # Seleccionamos desde-hasta y mostramos las 3 columnas 






----------------------------------------------------------------