قياس فعالية نموذج اكتشاف الرسائل غير المرغوب فيها في خدمة الرسائل القصيرة استناداً على تقنيات التعلم الآلي

المؤلفون

  • أحمد حامد عثمان
  • محمد بدوي الخليفة

الكلمات المفتاحية:

الدقة
التصنيف
تعلم الآلة
مجموعة البيانات
عشوائية
معالجة اللغة الطبيعية

الملخص

مع زيادة استخدام الهواتف المحمولة، زاد استخدام خدمة الرسائل القصيرة بشكل هائل أدى إلى انخفاض تكلفة الرسائل النصية، بدأ الناس في استخدامها لأغراض ترويجية وأنشطة غير أخلاقية. مما أدى ذلك أيضاً إلى زيادة هائلة في الرسائل العشوائية (Spam) وبالتالي يحصل فقدان البيانات الشخصية والمالية. ولمنع فقدان البيانات من الضروري اكتشاف الرسائل العشوائية في أسرع وقت ممكن. تهدف هذه الورقة إلى تصنيف الرسائل العشوائية ليس فقط بشكل فعال، ولكن أيضًا في وقت قصير ، كما انه يعد هذا البحث قابل للتطبيق في الدول الناطقة باللغة الإنجليزية او يتم ارسال الرسائل النصية فيها للمستخدمين باللغة الإنجليزية حتى يومنا هذا.
تم استخدام مجموعة بيانات تحتوي على آلاف الرسائل النصية التي تحتوي على رسائل نصية (Ham) ورسائل نصية عشوائية (Spam). تم استخدام تقنيات معالجة اللغة الطبيعية وخوارزميات تعلم الآلة (مصنف بايز الساذج(Naive Bayes ) وشجرة القرار((Decision Tre والغابة العشوائية Random Forest))) التي يمكننا من خلالها تصنيف نوع الرسالة. بعد تطبيق هذه الخوارزميات، حصلت خوارزمية Random Forest على أفضل دقة 0.99% في 0.15 ثواني.

السير الشخصية للمؤلفين

أحمد حامد عثمان

كلية علوم الحاسوب وتقانة المعلومات | جامعة المشرق | السودان

محمد بدوي الخليفة

كلية علوم الحاسوب وتقانة المعلومات | جامعة المشرق | السودان

التنزيلات

منشور

2023-03-30

كيفية الاقتباس

1.
قياس فعالية نموذج اكتشاف الرسائل غير المرغوب فيها في خدمة الرسائل القصيرة استناداً على تقنيات التعلم الآلي. JESIT [انترنت]. 30 مارس، 2023 [وثق 29 مارس، 2024];7(1):58-6. موجود في: https://journals.ajsrp.com/index.php/jesit/article/view/6303

إصدار

القسم

المقالات

كيفية الاقتباس

1.
قياس فعالية نموذج اكتشاف الرسائل غير المرغوب فيها في خدمة الرسائل القصيرة استناداً على تقنيات التعلم الآلي. JESIT [انترنت]. 30 مارس، 2023 [وثق 29 مارس، 2024];7(1):58-6. موجود في: https://journals.ajsrp.com/index.php/jesit/article/view/6303