Find Uniqueness in a column without null values

15 Aug 2020

import pandas as pd

df = pd.read_csv('train.csv')
df.head()

	ID	target	...
0	000d6aaf2	38000000.0	...
1	000fbd867	600000.0	...
2	0027d6b71	10000000.0	...
3	0028cbf45	2000000.0	...
4	002a68644	14400000.0	...

5 rows × 4993 columns

unique_vals = df.nunique().reset_index() #Doesn't count null values by default
unique_vals.columns = ["Column Name", "Uniqueness"]
unique_vals.head()