تعزيز التعرف على الوجه عبر الأعمار باستخدام شبكات T2T-ViT وتحليل الانتباه متعدد الأحجام
الكلمات المفتاحية:
الملخص
يقدم هذا البحث نموذجًا للتعرف على الوجوه عبر الأعمار يدمج شبكات الالتفاف العصبية (CNN) مع المحولات (Transformers). يستخدم النموذج في البداية شبكة T2T-ViT القابلة للفصل بالعمق لاستخراج ميزات الوجه الغنية. بعد ذلك، يستخدم وحدة تحليل الانتباه متعددة الأحجام لفك الترابط اللاخطي بين ميزات العمر والهوية. يتم تقييد تحليل الميزات مشتركًا بواسطة تقليل المعلومات المتبادلة، والتقاطع الإنتروبي، ووظيفة Arcface. يحقق النموذج معدلات دقة تبلغ 94.97%، و99.51%، و95.81% على ثلاث مجموعات بيانات معيارية: FG-NET، وCACD_VS، وCALFW، على التوالي، متطابقة أو تفوق أداء الحالة الفنية (SOTA). تشير هذه النتائج إلى أن النموذج المقترح يمكنه استخراج معلومات وجهية قوية وفك الترابط بين الميزات بكفاءة، محققًا أداء تعرف متقدمًا.
التنزيلات
منشور
كيفية الاقتباس
إصدار
القسم
الرخصة
الحقوق الفكرية (c) 2024 المؤسسة العربية للعلوم ونشر الأبحاث
هذا العمل مرخص بموجب Creative Commons Attribution-NonCommercial-NoDerivatives 4.0 International License.