العمل على “الاستيفاء” لإسناد القيم المفقودة وأهمية ترتيب نقاط البيانات للعملية

[ad_1]

تعريف الاستيفاء – يتنبأ الاستيفاء بالقيم عند نقطة ما من خلال دراسة النقاط المجاورة لها (داخل نفس العمود)، على عكس نمذجة البيانات حيث يتم أخذ جميع الأعمدة في الاعتبار عند دراسة العلاقة بين النقاط.

ما حاولت:

فيما يلي النقاط التي تم جمعها كجزء من بحثي حول الاستيفاء وشكوكي:

1. يفترض الاستيفاء السلاسة والاستمرارية بين نقاط البيانات المتتالية عند الاتصال باستخدام المنحنيات/الخطوط. لذا فإن خلط/فرز القيم في العمود سيؤثر على خطوط/منحنيات الاستيفاء والنتائج اللاحقة بشكل سلبي. وبالتالي، يجب ألا نقوم بتعديل ترتيب نقاط البيانات في مجموعة البيانات.

الشك – عندما يتم رسم نقاط البيانات هذه على رسم بياني، فإن قرب القيم/نقاط البيانات من بعضها البعض سيعتمد على حجم القيم على أي حال، أي أن القيم الأقرب في العدد ستكون أقرب إلى بعضها البعض. لا يهم كيف تم ترتيبها في مجموعة البيانات. فلماذا يوجد الكثير من التركيز على الحفاظ على الترتيب الأصلي لقيم مجموعة البيانات؟

وما مدى جدوى افتراض أن الشخص الذي قام بإعداد مجموعة البيانات قد قام بترتيب القيم بترتيب يضمن الاستمرارية والسلاسة بين نقاط البيانات في العمود قيد النظر؟ لا نعرف أي عمود تم اعتباره مفتاحًا لترتيب الصفوف.

ملحوظة: لقد شرحت فهمي والشكوك بالتفصيل قدر الإمكان. في حالة فهمي خاطئ أو أسئلتي غير واضحة، اسمحوا لي أن أعرف.

الحل 1

أولاً، لا يوجد رمز لتقديم تعليقات هنا، لذا فإن الإجابة ليست جيدة جدًا في هذا الصدد.

في الرياضيات، هناك طرق مختلفة لاستكمال النقاط. هناك الاستيفاء اللاغرانجي، أو الاستيفاء نيوتن. هذه هي نفس المبادئ التي تستخدم جميع النقاط لتناسب منحنى متعدد الحدود ذو الترتيب الأعلى الذي يمر عبر كل نقطة.

هناك خطوط تستخدم تناسبات متعددة الحدود ذات ترتيب منخفض لإنشاء منحنى، وهنا يمكنك استخدام تناسب المربعات الصغرى لدرجات متعددة الحدود معينة.

المشكلة التي تواجهك هي في الواقع تحديد ما تريده بالفعل، وأنت لم تفعل ذلك.

[ad_2]