Advertisement
Not a member of Pastebin yet?
Sign Up,
it unlocks many cool features!
- #1. Сколько мужчин / женщин находилось на борту?
- print(len(data[(data['Sex'] == 'male')]))
- print(len(data[(data['Sex'] == 'female')]))
- #2 Выведите рапределение по переменной Pclass (социально-экономический статус). Дополнительно - это же распределение только для мужчин / женщин.
- data['Pclass'][data['Sex']=='male'].hist()
- data['Pclass'][data['Sex']=='female'].hist()
- #3 Сколько в среднем заплатил один пассажир? Найдите дисперсию этой величины. Сколько все пассажиры заплатили в сумме
- print(data['Fare'].mean())
- print(data['Fare'].std())
- print(data['Fare'].sum())
- #4 Правда ли, что молодые выживали чаще (с большей вероятностью), чем старики? Пусть "молодые" - те, кто моложе 30, а "старики" - те, кто старше 60
- if len(data['Survived'][data['Age']<30])/len(data[data['Survived']==1])>len(data['Survived'][data['Age']>60])/len(data[data['Survived']==1]):
- print(True)
- else:
- print(False)
- #5 Правда ли, что женщины выживали чаще мужчин?
- if len(data['Survived'][data['Sex']=="female"])/len(data[data['Sex']=='female'])>len(data['Survived'][data['Sex']=='male'])/len(data[data['Sex']=='male']):
- print(True)
- else:
- print(False)
- #6. Какое самое популярное имя среди пассажиров Титаника мужского пола?
- def get_short_name(name):
- name=name[name.find(',')+1:]
- name=name[name.find('.')+1:]
- return name
- s=data[data['Sex']=='male']['Name'].apply(get_short_name)
- ss=s.value_counts().to_dict()
- print(list(ss.keys())[0],' ',list(ss.values())[0])
- #7. Сравните распределение стоимости билетов у спасенных и у погибших.
- data['Fare'][data['Survived']==1].hist()
- plt.show()
- data['Fare'][data['Survived']==0].hist()
- #8.Как отличается средний возраст мужчин / женщин в зависимости от класса обслуживания?
- data[(data['Sex']=="male") & (data['Pclass']==1)]['Age'].hist()
- plt.show()
- data[(data['Sex']=="male") & (data['Pclass']==2)]['Age'].hist()
- plt.show()
- data[(data['Sex']=="male") & (data['Pclass']==3)]['Age'].hist()
- plt.show()
- data[(data['Sex']=="female") & (data['Pclass']==1)]['Age'].hist()
- plt.show()
- data[(data['Sex']=="female") & (data['Pclass']==2)]['Age'].hist()
- plt.show()
- data[(data['Sex']=="female") & (data['Pclass']==3)]['Age'].hist()
- plt.show()
Advertisement
Add Comment
Please, Sign In to add comment
Advertisement