Problèmes avec le tracé marin

la programmation


Bonjour à tous,

Je suis un peu nouveau dans le traçage marin et lorsque j’utilise le code suivant, les chiffres semblent un peu bizarres et je suppose qu’ils ne sont pas exactement ce qu’ils doivent être. Pouvez-vous s’il vous plaît me guider là où je manque ?

Ce que j’ai essayé :

import pandas as pd
import numpy as np
import matplotlib.pyplot as plt
import seaborn as sns
import plotly as px

Titanic=sns.load_dataset("titanic")
sns.countplot(x='age', data=Titanic) # x-ticks are overlapping

sns.violinplot(data=Titanic, x="age", y="fare", hue="class") # same problem
sns.pairplot(Titanic) # give and error
sns.boxenplot(data=Titanic,x="age", y="fare", hue="class") # graph is too bad as well as same error as previous.
sns.violinplot(data=Titanic, x="age", y="fare", hue="class") # graph is too bad as well as same error as previous.
sns.countplot(x='age', data=Titanic) # x-ticks are overlapping

Solution 1

Vous avez besoin d’aide avec vos complots Seaborn. Abordons-les un par un :

1. X-ticks qui se chevauchent dans `sns.countplot` : Cela se produit généralement lorsqu’il y a trop de valeurs uniques dans la colonne « âge ». Pour rendre le tracé plus lisible, vous pouvez soit augmenter la taille de la figure, soit faire pivoter les étiquettes x-tick.

2. Problèmes avec `sns.violinplot`, `sns.boxenplot` et `sns.pairplot` : Ces problèmes peuvent survenir en raison de la nature des données contenues dans les colonnes « âge » et « tarif ». La colonne « âge » peut contenir des valeurs NaN, ou la plage de « tarif » peut être trop large, ce qui entraîne des tracés asymétriques.

3. Erreur avec `sns.pairplot` : Cette erreur peut être due à des valeurs non numériques ou NaN dans l’ensemble de données. `sns.pairplot` ne fonctionne qu’avec des colonnes numériques et ne peut pas bien gérer les valeurs NaN.

Voici quelques ajustements de code et conseils pour résoudre ces problèmes :

Ajustement du compte-plot

Python
plt.figure(figsize=(10, 6)) # Adjusting figure size
sns.countplot(x='age', data=Titanic)
plt.xticks(rotation=90)  # Rotating x-ticks
plt.show()

Manipulation des intrigues en violon et en boxen

Pour « sns.violinplot » et « sns.boxenplot », assurez-vous que les colonnes « âge » et « tarif » n’ont pas de valeurs NaN ou de valeurs aberrantes qui pourraient fausser le tracé. Vous pouvez gérer les valeurs NaN en les supprimant ou en les remplissant avec une mesure de tendance centrale (moyenne, médiane).

Python
# Handling NaN values
Titanic = Titanic.dropna(subset=['age', 'fare'])

# Now try plotting
sns.violinplot(data=Titanic, x="age", y="fare", hue="class")
plt.show()

sns.boxenplot(data=Titanic, x="age", y="fare", hue="class")
plt.show()

Correction du tracé de paires

Pour corriger le « sns.pairplot », assurez-vous que toutes les colonnes sont numériques et gèrent les valeurs NaN.

Python
# Dropping non-numeric columns for pairplot
numeric_cols = Titanic.select_dtypes(include=[np.number]).columns.tolist()
Titanic_numeric = Titanic[numeric_cols].dropna()

sns.pairplot(Titanic_numeric)
plt.show()

Pourriez-vous essayer ces ajustements et voir s’ils résolvent les problèmes de vos parcelles ? Si vous rencontrez toujours des problèmes, les messages d’erreur spécifiques peuvent fournir plus d’informations sur ce qui pourrait ne pas fonctionner.

コメント

タイトルとURLをコピーしました