كل ما تريد معرفته عن DarkBERT بوابة الانترنت المظلم

News
تم تدريبه على مجموعات بيانات مأخوذة حصريًا من الأنترنت. DarkBERT طريقك الى بوابة الأنترنت المظلم
Mostafa Tamam
June 17, 2023, 1:30 a.m.
mostafa_tamam
كل ما تريد معرفته عن DarkBERT بوابة الانترنت المظلم

مقدمة

يعيش العالم الرقمي في عصر التكنولوجيا المتقدمة، حيث يزداد استخدام الذكاء الاصطناعي في مجالات متعددة. واحدة من أحدث التطورات في هذا المجال هي ظهور DarkBERT، وهو خطوة غير مسبوقة فى مجال الذكاء اصطناعي حيث انه تم تدريبه حصريًا على بيانات Dark Web، في هذه المقالة، سنستكشف ما هو DarkBERT وكيف يمكن أن يؤثر في فهم وتحليل المحتوى الموجود على الأنترنت المظلم.

ما هو DarkBERT ؟

يعد DarkBERT نموذج تشفير يعتمد على المحولات (Transformers)، ومستند إلى RoBERTa و RoBERTa هنا تمثل نموذج لغوي مبتكر وقوي الذي تم تطويره بناءً على نموذج BERT (Bidirectional Encoder Representations from Transformers). اسم RoBERTa هو اختصار لـ "A Robustly Optimized BERT Pretraining Approach"، والذي يشير إلى تحسينات شاملة أُدخلت على نموذج BERT لزيادة قدرته على التعامل مع مجموعة واسعة من المهام اللغوية.

تم تدريب DarkBERT على ملايين صفحات الويب المظلمة ، بما في ذلك البيانات من منتديات القرصنة ومواقع الاحتيال والمصادر الأخرى عبر الإنترنت المرتبطة بالأنشطة غير القانونية. مما يسمح له بتفوق على نماذج مماثلة في مهام مراقبة أو تفسير محتوى الأنترنت المظلم..

يشير مصطلح "الأنترنت المظلم" إلى قسم إنترنت مخفي لا يمكن الوصول إليه عبر متصفحات الويب القياسية. يشتهر القسم الفرعي بإيواء مواقع ويب مجهولة المصدر وأسواق مشهورة بالأنشطة غير القانونية ، مثل تجارة البيانات المسروقة والمخدرات والأسلحة  تتمتع S2W المطورة لـ DarkBERT بتاريخ من مراقبة الأنترنت المظلم والبحث فيه ، وتقديم رؤى لهجمات التصيد الأحتيالى وتقييم على نطاق واسع حول خدمات الويب المخفية للتصيد الاحتيالي.

لنأخد على سبيل المثال هذا التسريب الذى يتضمن : 

  • Ransomware Leak Site Detection
  • Noteworthy Thread Detection
  • Threat Keyword Inference

Source: Ransomware leak (cybersecuritynews)

ما هى مميزات DarkBERT ؟

يتمتع DarkBERT بفهم رائع للغة مجرمي الإنترنت ويتفوق في اكتشاف التهديدات المحتملة المحددة. يمكنه البحث في الويب المظلم وتحديد تهديدات الأمن السيبراني والإبلاغ عنها بنجاح مثل تسرب البيانات وبرامج الفدية ، مما يجعلها أداة مفيدة محتملة لمكافحة التهديدات السيبرانية.

يشير البحث المنشور على arxiv لتقييم فعالية DarkBERT ، قارنه الباحثون بنموذجين مشهورين من NLP ، BERT و RoBERTa ، ولتقييم أدائهم عبر بعض حالات استخدام ذات صلة بالأمن السيبراني وهما : 

1- رصد وتحليل المحتوى الغامض

يعد DarkBERT أداة قوية لرصد وفهم المحتوى الموجود على الأنترنت المظلم. يمكن استخدامه في مجالات مثل مكافحة الجرائم الإلكترونية ومكافحة الإرهاب الإلكتروني، حيث يمكنه التعرف على الأنماط اللغوية والمفردات المستخدمة في المحتوى الغامض واكتشاف الأنشطة غير القانونية.

2- فلترة المحتوى الضار

يمكن استخدام DarkBERT في تصفية المحتوى الضار والمخالف للسياسات والأخلاقيات على الويب. يمكن للنموذج تحليل النصوص وتحديد المحتوى الذي ينطوي على تهديدات، أو الكراهية، أو الإيحاءات الجنسية، وبالتالي يسهم في خلق بيئة أكثر أمانًا على الإنترنت.

3- تحسين أنظمة البحث

يمكن استخدام DarkBERT لتحسين أنظمة البحث على الأنترنت المظلم. يمكن للنموذج تحسين التوصيات ونتائج البحث من خلال فهم أعمق للنصوص والاستفادة من المعرفة الغامضة المكتسبة أثناء التدريب.

4- التحقق من الهوية والاحتيال

يعد DarkBERT أيضًا قادرًا على تحسين أنظمة التحقق من الهوية وكشف الاحتيال. يمكن استخدامه لتحليل النصوص والكشف عن الأنماط الغريبة أو المشبوهة التي قد تشير إلى تلاعب أو تزوير.

5- مراقبة منتديات الويب المظلمة 
تعد مراقبة منتديات الويب المظلمة ، والتي تُستخدم بشكل شائع لتبادل المعلومات غير المشروعة ، أمرًا بالغ الأهمية لتحديد المواضيع التي يحتمل أن تكون خطرة. ومع ذلك ، قد تستغرق المراجعة اليدوية لهذه العملية وقتًا طويلاً ، مما يجعل هذة العملية بشكل تلقائى مفيدة لخبراء الأمن.

هل DarkBERT متاح حاليا للأستخدام ؟ 

 DarkBERT غير متاح حاليًا للجمهور ، لكن الباحثين بأمكانهم تمكينك من نسخة من النموذج بناء على طلبات استخدامه للأغراض الأكاديمية.

الملخص 

تم تدريب DarkBERT مسبقًا على بيانات الويب المظلمة وتفوقها على نماذج اللغة الحالية عبر العديد من حالات استخدام الأمن السيبراني ، مما يجعلها أداة حاسمة لتطوير أبحاث الويب المظلمة.

يتمتع الذكاء الاصطناعي المدرب على الأنترنت المظلم بإمكانية استخدامه في العديد من مهام الأمن السيبراني ، بما في ذلك تحديد مواقع الويب التي تبيع البيانات السرية المسربة ، ومراقبة منتديات الويب المظلمة للكشف عن مشاركة المعلومات غير المشروعة ، وتحديد الكلمات الرئيسية المتعلقة بالتهديدات السيبرانية. ويبقى عمل هذا النموذج قيد التقدم والتطوير فنحن فى عصرتطوير الذكاء الأصطناعى فلذلك احرص على تعلمك بأستمرار والسلام ختام smiley

المصادر 

[ * ] DarkBERT: A Language Model for the Dark Side of the Internet

[ * ] DarkBERT: A New AI Trained Exclusively on the Dark Web

[ * ] DarkBERT - AI Model Trained on DARK WEB


DarkBERT darkbert-ai dark web root-x RoBERTa Mostafa Tamam