استخدام OpenAI API للكشف عن الرسائل النصية القصيرة غير المرغوب فيها | بواسطة أماندا إغليسياس مورينو

eilm

0 6 5 دقائق

استخدام OpenAI API للكشف عن الرسائل النصية القصيرة غير المرغوب فيها | بواسطة أماندا إغليسياس مورينو

فتح تصنيف فعال للنص باستخدام نماذج مدربة مسبقًا: دراسة حالة باستخدام OpenAI’s GPT-3.5-turbo

الصورة بواسطة https://unsplash.com/es/@tma

تقليديًا، سيبدأ أي مشروع لتصنيف نص معالجة اللغة الطبيعية بجمع الحالات، وتحديد التسميات الخاصة بها، وتدريب نموذج التصنيف، مثل نموذج الانحدار اللوجستي، لتصنيف الحالات. حاليا، يمكن استخدام النماذج المتوفرة في OpenAI مباشرة لمهام التصنيف يتطلب ذلك عادةً جمع كمية كبيرة من البيانات المصنفة لتدريب النموذج. يمكن استخدام هذه النماذج المدربة مسبقًا لمهام معالجة النصوص المتعددة، بما في ذلك التصنيف والتلخيص والتدقيق الإملائي وتحديد الكلمات الرئيسية.
لا نطلب أي بيانات مصنفة أو الحاجة إلى تدريب نموذج. بسيطة، أليس كذلك؟

يوفر ChatGPT واجهة رسومية للنماذج التي تنفذها OpenAI. ومع ذلك، ماذا لو أردنا تشغيل هذه النماذج مباشرة في بايثون؟ حسنًا، البديل المتاح هو OpenAI API، والذي يسمح لنا بالوصول إلى نماذجهم من بيئة برمجة. في هذه المقالة، سنصف بمثال موجز كيف يمكننا الوصول إلى واجهة برمجة التطبيقات (API) لاكتشاف ما إذا كانت الرسالة النصية القصيرة عبارة عن رسالة غير مرغوب فيها أم لا. ولتحقيق ذلك، سوف نستخدم أحد نماذج Open AI، وبالتحديد نموذج GPT-3.5-turbo.

الخطوة الأولى للوصول إلى تتضمن OpenAI API إنشاء حساب على OpenAI للحصول على مفتاح API المطلوبة للوصول إلى النماذج. عند إنشاء الحساب، سيكون لدينا رصيد بقيمة 5 دولارات تحت تصرفنا، والذي، كما سنلاحظ لاحقًا، سيسمح لنا بإجراء العديد من الاختبارات.

في هذا المثال، سنستخدم الإصدار المجاني من OpenAI، والذي يأتي مع قيود على الطلبات في الدقيقة واليوم. يعد الالتزام بهذه الحدود أمرًا بالغ الأهمية لتجنب أخطاء حدود السعر. يتم تعيين قيم هاتين المعلمتين على 3 طلبات في الدقيقة و200 في اليوم. وفي حين أن هذا يفرض قيودًا بطبيعة الحال، خاصة بالنسبة للمشاريع واسعة النطاق، إلا أنه يكفي لأغراض مثال هذه المقالة.

بمجرد أن أنشأنا الحساب، يمكننا الوصول إلى نماذج OpenAI المتوفرة للإصدار المجاني من Python باستخدام مكتبة OpenAI. أولا نقوم بإنشاء دالة تسمى chat_with_gpt للوصول إلى طراز GPT-3.5-turbo. سيكون الإدخال لهذه الوظيفة هو promptوالتي سنقوم بتصميمها لاحقاً.