ممارسات البيانات الضخمة والتعلم الآلي في Palo Alto Networks

Built for Speed: ~10ms Latency, Even Under Load
Blazingly fast way to build, track and deploy your models!
- Handles 350+ RPS on just 1 vCPU — no tuning needed
- Production-ready with full enterprise support
التعلم الآلي في بالو ألتو نتوركس: تعزيز الأمن السيبراني من خلال الابتكار
في المشهد الرقمي سريع التطور اليوم، ومع توسع الشركات في بصماتها الرقمية، تصبح الحاجة إلى الكشف المتقدم عن التهديدات ومعالجتها أولوية قصوى. في صميم هذه المهمة في بالو ألتو نتوركس تكمن بنية تحتية قوية للتعلم الآلي (ML) تدعم حلول الشركة الأمنية المتطورة. تستكشف هذه المدونة ممارسات التعلم الآلي في بالو ألتو نتوركس، مستقاة من محادثة مع هارش فيرما، مهندس برمجيات أول يعمل عند تقاطع التعلم الآلي والبيانات الضخمة.
دور التعلم الآلي في الأمن السيبراني
تعد نماذج التعلم الآلي جزءًا لا يتجزأ من كل من اكتشاف الانتهاكات الأمنية المحتملة والتخفيف من حدتها. تحلل هذه النماذج كميات هائلة من البيانات الناتجة عن حركة مرور الشبكة واستخدام البرامج والأنشطة الرقمية الأخرى لتحديد الأنماط التي تشير إلى سلوك ضار.
كما يوضح هارش، فإن المهام الأساسية للتعلم الآلي في الأمن السيبراني ذات شقين:
- الكشف: تحديد التهديدات المحتملة من خلال تحليل سجلات حركة المرور وبيانات الشبكة.
- المعالجة: تقديم حلول للتخفيف من التهديدات المكتشفة، مثل تعزيز سياسات الأمان أو توفير رؤى قابلة للتنفيذ للمستخدمين.
تتطلب هذه المهام المعالجة المستمرة لمجموعات البيانات الضخمة، حيث يمكن لنماذج التعلم الآلي تحديد الحالات الشاذة أو الأنماط التي قد تشير إلى اختراق أمني. تعد القدرة على معالجة البيانات وتحليلها على نطاق واسع أمرًا بالغ الأهمية، حيث يمكن أن تظهر التهديدات بأشكال مختلفة، من أنماط حركة المرور غير العادية إلى نشاط البرامج المشبوه.
الرحلة من هندسة البرمجيات إلى التعلم الآلي
بدأت رحلة هارش إلى عالم التعلم الآلي بأساس قوي في هندسة البرمجيات. بعد انتقاله إلى الولايات المتحدة للحصول على درجة الماجستير في علوم الكمبيوتر، ركز على الذكاء الاصطناعي (AI) والتعلم الآلي.
عمل كمساعد باحث في مجالات مثل معالجة اللغة الطبيعية ورؤية الكمبيوتر. أرسى هذا الخلفية الأكاديمية الأساس لانتقاله إلى أدوار التعلم الآلي داخل الصناعة.
عند انضمامه إلى بالو ألتو نتوركس، شارك هارش في بناء برمجيات تعزز أمان الشبكة من خلال التعلم الآلي. كان الانتقال من هندسة البرمجيات إلى التعلم الآلي مدفوعًا بالرغبة في مواجهة تحديات أكثر تعقيدًا وتطورًا. كما يشير هارش، فإن مجال التعلم الآلي ليس صارمًا فحسب، بل ديناميكي أيضًا، ويقدم فرصًا مستمرة للتعلم والابتكار.
العمليات الأسبوعية: مواجهة تحديات الأمن السيبراني
يتضمن دور هارش في بالو ألتو نتوركس معالجة تحديات الأمن السيبراني المختلفة من خلال التعلم الآلي. تتمحور العمليات الأسبوعية حول المراقبة المستمرة لنشاط الشبكة، وتحديد التهديدات المحتملة، وتطوير نماذج يمكنها التنبؤ بهذه التهديدات ومنعها.
يؤكد هارش على أهمية كل من المعالجة في الوقت الفعلي والمعالجة الدفعية في هذه العمليات. بينما تعد المعالجة في الوقت الفعلي حاسمة للكشف الفوري عن التهديدات، تسمح المعالجة الدفعية بتحليل اتجاهات البيانات طويلة الأجل، مما يساعد على تحسين النماذج وتطوير قدرات الكشف عن التهديدات المستقبلية.
المعالجة في الوقت الفعلي مقابل المعالجة الدفعية: نهج متوازن
تعتمد فعالية التعلم الآلي في الأمن السيبراني بشكل كبير على كيفية معالجة البيانات. في بالو ألتو نتوركس، يتم استخدام مزيج من المعالجة في الوقت الفعلي والمعالجة الدفعية لإدارة البيانات واستخلاص الرؤى.
- المعالجة في الوقت الفعلي: هذا ضروري للكشف الفوري عن التهديدات. على سبيل المثال، إذا قام مستخدم بالوصول إلى موقع ويب قد يكون ضارًا، يحتاج النظام إلى الاستجابة فورًا لمنع أي اختراق أمني. تضمن المعالجة في الوقت الفعلي أن نماذج التعلم الآلي تحلل باستمرار تدفقات البيانات الواردة وتحدد أي نشاط مشبوه.
- المعالجة الدفعية: تُستخدم المعالجة الدفعية لتحليل البيانات على فترات زمنية أطول، مثل تحديد التهديدات المحتملة بناءً على سجلات حركة المرور من الثلاثين يومًا الماضية. يتيح هذا النهج للنظام اكتشاف أنماط قد لا تكون واضحة على الفور في التحليل في الوقت الفعلي. على سبيل المثال، إذا كان نوع معين من حركة المرور يطلق تنبيهات باستمرار، يمكن أن تساعد المعالجة الدفعية في فهم ما إذا كان هذا تهديدًا جديدًا أم إيجابيًا خاطئًا.
يضمن الجمع بين طريقتي المعالجة هاتين أن تكون حلول الأمن من بالو ألتو نتوركس سريعة الاستجابة وشاملة في آن واحد، وقادرة على معالجة التهديدات الفورية مع التعلم أيضًا من البيانات التاريخية.
بناء ونشر نماذج التعلم الآلي
يتبع تطوير نماذج التعلم الآلي في بالو ألتو نتوركس مسارًا منظمًا جيدًا، بدءًا من استيعاب البيانات وصولاً إلى نشر النموذج وتقديمه. يوضح "هارش" الخطوات الرئيسية في هذه العملية:
- استيعاب البيانات والمعالجة المسبقة: تتضمن الخطوة الأولى جمع البيانات وتنظيفها. هذه مرحلة حاسمة حيث تؤثر جودة البيانات بشكل مباشر على أداء نماذج التعلم الآلي. قد يتضمن استيعاب البيانات تدفق البيانات من مصادر مختلفة، مثل سجلات الشبكة أو سجلات استخدام البرامج.
- هندسة الميزات: بمجرد استيعاب البيانات، تتمثل الخطوة التالية في هندسة ميزات ذات معنى يمكن استخدامها لتدريب النماذج. قد يتضمن ذلك تحويل البيانات الخام إلى تنسيقات يمكن للنموذج تفسيرها بسهولة، مثل تحويل بيانات السجل إلى ميزات رقمية.
- تدريب النموذج: بعد إعداد الميزات، يتم تدريب نماذج التعلم الآلي باستخدام مجموعات بيانات كبيرة. قد يتضمن التدريب استخدام مزيج من خوارزميات التعلم الآلي التقليدية والتطورات الأحدث، مثل نماذج اللغات الكبيرة (LLMs) لمهام محددة.
- نشر النموذج: بعد التدريب، يتم نشر النماذج في بيئة إنتاج حيث يمكنها تحليل البيانات الحية. يتضمن النشر إعداد النماذج بحيث يمكن الوصول إليها بواسطة أنظمة مختلفة في الوقت الفعلي.
- تقديم النموذج: أخيرًا، يتم تقديم النماذج المنشورة للعملاء، مما يوفر لهم الرؤى والتنبيهات اللازمة للحفاظ على أمن سيبراني قوي. قد يتضمن ذلك دمج النماذج مع منصات الأمان الحالية أو إنشاء أدوات جديدة تستفيد من تنبؤات النماذج.
المكدس التقني: الأدوات والمنصات
تستخدم بالو ألتو نتوركس مكدسًا تقنيًا متنوعًا لدعم مبادراتها في التعلم الآلي. يشمل ذلك أدوات لمعالجة البيانات وتدريب النماذج ونشرها:
- معالجة البيانات: تستخدم الشركة Apache Spark لمعالجة مجموعات البيانات الكبيرة. إن قدرة Spark على التعامل مع أعباء عمل البيانات الضخمة تجعلها مثالية لأنواع مهام الدُفعات التي تديرها Palo Alto Networks، مثل معالجة سجلات حركة المرور أو تحليل البيانات التاريخية لأنماط التهديدات.
- منصات البث: لجمع البيانات في الوقت الفعلي، تُستخدم منصات مثل Apache Kafka و Google Pub/Sub. تتيح هذه الأدوات التدفق المستمر للبيانات من مصادر مختلفة، مما يضمن حصول نماذج التعلم الآلي على أحدث المعلومات.
- الخدمات السحابية: غالبًا ما يتم تدريب ونشر نماذج التعلم الآلي في Palo Alto Networks باستخدام منصات سحابية مثل Google Cloud Platform (GCP) و Amazon Web Services (AWS). تقدم هذه المنصات خدمات مُدارة مثل Google DataProc لتشغيل مهام Spark و Amazon SageMaker أو Google Vertex AI لتدريب النماذج ونشرها.
- حلول التخزين: يتم التعامل مع تخزين البيانات من خلال مزيج من الخدمات، اعتمادًا على متطلبات المشروع. ويشمل ذلك استخدام حاويات S3 أو GCS لتخزين البيانات الأولية، و BigQuery للتحليلات، ومخازن الميزات المخصصة لتخزين الميزات المُهندسة.
- منصات التعلم الآلي: لإدارة النماذج ونشرها، تُستخدم منصات مثل SageMaker و Vertex AI. توفر هذه المنصات بيئات متكاملة لبناء وتدريب ونشر نماذج التعلم الآلي على نطاق واسع.
دمج الذكاء الاصطناعي التوليدي
مع تطور مجال التعلم الآلي، بدأت Palo Alto Networks في دمج الذكاء الاصطناعي التوليدي في حلولها للأمن السيبراني. يقدم الذكاء الاصطناعي التوليدي، وخاصة نماذج اللغة الكبيرة، إمكانيات جديدة للكشف عن التهديدات والاستجابة لها. يمكن استخدام هذه النماذج لتوليد تنبؤات أو محاكاة سيناريوهات التهديدات المحتملة، مما يوفر رؤى أعمق حول كيفية منع الاختراقات الأمنية.
يذكر هارش أنه بينما لا تزال نماذج التعلم الآلي التقليدية هي العمود الفقري لحلول الأمن السيبراني في Palo Alto Networks، فإن دمج الذكاء الاصطناعي التوليدي يمثل تطورًا مثيرًا. من خلال الاستفادة من كل من نماذج التعلم الآلي الكلاسيكية والذكاء الاصطناعي التوليدي الحديث، تستطيع الشركة تعزيز قدراتها في الكشف عن التهديدات، وتقديم حلول أمنية أكثر شمولاً لعملائها.
التحديات والتوجهات المستقبلية
لا يخلو دمج التعلم الآلي في الأمن السيبراني من التحديات. إحدى الصعوبات الرئيسية هي ضمان بقاء النماذج فعالة مع تطور مشهد التهديدات. تتغير تهديدات الأمن السيبراني باستمرار، ويجب تحديث نماذج التعلم الآلي باستمرار للتعرف على أنماط السلوك الضار الجديدة.
التحدي الآخر هو التوازن بين المعالجة في الوقت الفعلي والمعالجة الدفعية. فبينما يعد التحليل في الوقت الفعلي أمرًا بالغ الأهمية للكشف الفوري عن التهديدات، إلا أنه قد يستهلك الكثير من الموارد. وعلى العكس من ذلك، فإن المعالجة الدفعية أقل تطلبًا ولكنها قد تفوت التهديدات في الوقت الفعلي. تعالج Palo Alto Networks هذا باستخدام نهج هجين، يجمع بين نقاط القوة في كلتا الطريقتين.
تتطلع Palo Alto Networks إلى المستقبل، وتهدف إلى مواصلة الابتكار في مجال الأمن السيبراني. ويشمل ذلك المزيد من دمج الذكاء الاصطناعي التوليدي وتوسيع استخدام التعلم الآلي عبر منصات أمنية مختلفة. من خلال البقاء في طليعة التكنولوجيا، تأمل الشركة في أن تظل رائدة في توفير حلول أمن سيبراني قوية وقابلة للتطوير.
TrueFoundry AI Gateway delivers ~3–4 ms latency, handles 350+ RPS on 1 vCPU, scales horizontally with ease, and is production-ready, while LiteLLM suffers from high latency, struggles beyond moderate RPS, lacks built-in scaling, and is best for light or prototype workloads.
The fastest way to build, govern and scale your AI


















.png)
.webp)










.webp)






