Travail de « l’interpolation » pour imputer les valeurs manquantes et l’importance de l’ordre des points de données pour le processus

la programmation


Définition de l’interpolation – L’interpolation prédit les valeurs en un point en étudiant ses points voisins (au sein d’une même colonne), par opposition à la modélisation des données où toutes les colonnes sont prises en compte lors de l’étude de la relation entre les points.

Ce que j’ai essayé :

Voici les points recueillis dans le cadre de mes recherches sur l’interpolation & mes doutes :

1. L’interpolation suppose la douceur et la continuité entre les points de données consécutifs lorsqu’ils sont connectés à l’aide de courbes/lignes. Ainsi, le mélange/tri des valeurs dans la colonne affectera négativement les lignes/courbes d’interpolation et les résultats ultérieurs. Par conséquent, nous ne devons pas modifier l’ordre des points de données dans l’ensemble de données.

Doute – Lorsque ces points de données sont tracés sur un graphique, la proximité des valeurs/points de données les uns par rapport aux autres dépendra de toute façon de l’ampleur des valeurs, c’est-à-dire que les valeurs plus proches en nombre seront plus proches les unes des autres. Peu importe la manière dont ils ont été classés dans l’ensemble de données. Alors pourquoi met-on autant l’accent sur la préservation de l’ordre d’origine des valeurs de l’ensemble de données ?

Et dans quelle mesure est-il pratique de supposer que la personne qui a préparé l’ensemble de données a disposé les valeurs dans un ordre qui garantit la continuité et la fluidité entre les points de données de la colonne considérée ? Nous ne savons pas quelle colonne a été considérée comme la clé pour l’ordre des lignes.

Note: J’ai expliqué ma compréhension et mes doutes de manière aussi détaillée que possible. Si j’ai mal compris ou si mes questions ne sont pas claires, faites-le-moi savoir.

Solution 1

Tout d’abord, il n’y a pas de code sur lequel donner des commentaires ici, donc la réponse n’est pas très bonne à cet égard.

En mathématiques, il existe différentes manières d’interpoler des points. Il existe l’interpolation lagrangienne, ou interpolation de Newton. Ce sont les mêmes principes qui utilisent tous les points pour ajuster la courbe polynomiale d’ordre le plus élevé qui passe par chaque point.

Il existe des splines qui utilisent des ajustements polynomiaux d’ordre inférieur pour générer une courbe, et ici vous pouvez utiliser l’ajustement des moindres carrés d’un polynôme de degré donné.

Le problème que vous rencontrez est en fait de spécifier ce que vous voulez réellement, et vous ne l’avez pas fait.

コメント

タイトルとURLをコピーしました