Trabajo de ‘interpolación’ para imputar valores faltantes y la importancia del orden de los puntos de datos para el proceso

programación

[ad_1]

Definición de interpolación – La interpolación predice valores en un punto estudiando sus puntos vecinos (dentro de la misma columna), a diferencia del modelado de datos donde se tienen en cuenta todas las columnas al estudiar la relación entre puntos.

Lo que he probado:

Los siguientes son los puntos recopilados como parte de mi investigación sobre interpolación y mis dudas:

1. La interpolación asume suavidad y continuidad entre puntos de datos consecutivos cuando se conectan mediante curvas/líneas. Por lo tanto, mezclar/ordenar valores en la columna afectará negativamente las líneas/curvas de interpolación y los resultados posteriores. Por lo tanto, no debemos modificar el orden de los puntos de datos en el conjunto de datos.

Duda: cuando estos puntos de datos se trazan en un gráfico, la proximidad de los valores/puntos de datos entre sí dependerá de la magnitud de los valores de todos modos, es decir, los valores más cercanos en número estarán más cerca entre sí. No importa cómo se ordenaron en el conjunto de datos. Entonces, ¿por qué se pone tanto énfasis en preservar el orden original de los valores del conjunto de datos?

¿Y qué tan práctico es suponer que la persona que preparó el conjunto de datos dispuso los valores en un orden que garantice la continuidad y la fluidez entre los puntos de datos de la columna bajo consideración? No sabemos qué columna se ha considerado como clave para el orden de las filas.

Nota: He explicado mis conocimientos y dudas lo más detalladamente posible. En caso de que no entienda bien o mis preguntas no sean claras, hágamelo saber.

Solución 1

En primer lugar, no hay ningún código para dar comentarios aquí, por lo que la respuesta no es muy buena en ese sentido.

En matemáticas, existen diferentes formas de interpolar puntos. Existe la ineterpolación lagrangiana o interpolación de Newton. Estos son los mismos principios que utilizan todos los puntos para ajustar la curva polinómica de orden más alto que pasa por cada punto.

Hay splines que utilizan ajustes polinomiales de orden inferior para generar una curva, y aquí se puede utilizar el ajuste de mínimos cuadrados de un polinomio de grado determinado.

El problema que tienes es en realidad especificar lo que realmente quieres y no lo hiciste.

[ad_2]

コメント

Título y URL copiados