تقنية وتكنولوجيا

كيفية: النماذج الأساسية في السلاسل الزمنية | بواسطة هادن بيليتييه


لماذا (وكيف) يجب عليك إنشاء نموذج أساسي قبل تدريب نموذجك النهائي

نحو علم البيانات
الصورة بواسطة Zetong Li على Unsplash

لذلك قمت بجمع البيانات الخاصة بك. لقد حددت حالة العمل، وقررت نموذجًا مرشحًا (مثل Random Forest)، وقمت بإعداد بيئة التطوير الخاصة بك، ويديك على لوحة المفاتيح. أنت جاهز لبناء وتدريب نموذج السلسلة الزمنية الخاص بك.

انتظر – لا تبدأ بعد. قبل أن تقوم بتدريب واختبار نموذج Random Forest الخاص بك، يجب عليك ذلك قم أولاً بتدريب نموذج أساسي.

أ نموذج خط الأساس هو نموذج بسيط يستخدم لإنشاء معيار أو نقطة مرجعية، والتي ستبني عليها نموذج التعلم الآلي النهائي والأكثر تعقيدًا.

يقوم علماء البيانات بإنشاء نماذج أساسية للأسباب التالية:

  • يمكن أن تمنحك النماذج الأساسية فكرة جيدة عن كيفية أداء النموذج الأكثر تعقيدًا.
  • إذا كان أداء النموذج الأساسي سيئًا، فقد يكون ذلك علامة على وجود مشكلة في جودة البيانات التي تحتاج إلى معالجة.
  • إذا كان أداء النموذج الأساسي أفضل من النموذج النهائي، فقد يشير ذلك إلى مشكلات في تلك الخوارزمية أو الميزات أو المعلمات الفائقة أو المعالجة المسبقة الأخرى للبيانات.
  • إذا كان أداء النموذج الأساسي والنموذج المعقد متماثلًا تقريبًا، فقد يشير هذا إلى أن النموذج المعقد يحتاج إلى مزيد من الضبط الدقيق (في الميزات أو البنية أو المعلمات الفائقة). ويمكن أن يوضح أيضًا أن النموذج الأكثر تعقيدًا ليس ضروريًا، وأن النموذج الأبسط سيكون كافيًا.

عادةً ما يكون النموذج الأساسي هو أ النموذج الإحصائيمثل نموذج المتوسط ​​المتحرك. وبدلاً من ذلك، فهو إصدار أبسط من النموذج المستهدف – على سبيل المثال، إذا كنت ستقوم بتدريب نموذج Random Forest، فيمكنك أولاً تدريب نموذج Decision Tree كخط أساسي.

بالنسبة لبيانات السلاسل الزمنية، هناك خياران شائعان للنماذج الأساسية التي أود مشاركتها معك. يعمل كلاهما بشكل جيد لأنهما يفترضان ترتيبًا زمنيًا للبيانات ويقومان بالتنبؤات وفقًا لأنماط البيانات.

توقعات ساذجة

التوقعات الساذجة هي الأبسط – فهي تفترض أن القيمة التالية ستكون هي نفسها …

رابط المصدر

اترك تعليقاً

لن يتم نشر عنوان بريدك الإلكتروني. الحقول الإلزامية مشار إليها بـ *

زر الذهاب إلى الأعلى