Práticas de Big Data e ML na Palo Alto Networks

Built for Speed: ~10ms Latency, Even Under Load

Blazingly fast way to build, track and deploy your models!

Handles 350+ RPS on just 1 vCPU — no tuning needed
Production-ready with full enterprise support

Get Started with Truefoundry Now Talk to the Expert

Machine Learning na Palo Alto Networks: Aprimorando a Cibersegurança através da Inovação

No cenário digital em rápida evolução de hoje, à medida que as empresas expandem suas pegadas digitais, a necessidade de detecção e remediação avançada de ameaças torna-se uma prioridade. No centro dessa tarefa na Palo Alto Networks está uma infraestrutura robusta de machine learning (ML) que impulsiona as soluções de segurança de ponta da empresa. Esta publicação de blog explora as práticas de machine learning na Palo Alto Networks, extraindo insights de uma conversa com Harsh Verma, Engenheiro de Software Sênior que trabalha na interseção de ML e big data.

O Papel do Machine Learning na Cibersegurança

Os modelos de machine learning são essenciais tanto para detectar quanto para mitigar potenciais violações de segurança. Esses modelos analisam grandes volumes de dados gerados pelo tráfego de rede, uso de software e outras atividades digitais para identificar padrões indicativos de comportamento malicioso.

Como Harsh explica, as principais tarefas do machine learning em cibersegurança são duas:

Detecção: Identificar ameaças potenciais analisando logs de tráfego e dados de rede.
Remediação: Oferecer soluções para mitigar ameaças detectadas, como aprimorar políticas de segurança ou fornecer insights acionáveis aos usuários.

Essas tarefas exigem o processamento contínuo de conjuntos de dados massivos, onde os modelos de machine learning podem identificar anomalias ou padrões que podem sinalizar uma violação de segurança. A capacidade de processar e analisar dados em escala é crucial, pois as ameaças podem se manifestar de várias formas, desde padrões de tráfego incomuns até atividades de software suspeitas.

A Jornada da Engenharia de Software ao Machine Learning

A jornada de Harsh para o mundo do machine learning começou com uma sólida base em engenharia de software. Após se mudar para os Estados Unidos para seu Mestrado em Ciência da Computação, ele se concentrou em inteligência artificial (IA) e machine learning.

Ele trabalhou como assistente de pesquisa em áreas como processamento de linguagem natural e visão computacional. Essa formação acadêmica lançou as bases para sua transição para funções de machine learning na indústria.

Ao ingressar na Palo Alto Networks, Harsh esteve envolvido na construção de software que aprimora a segurança de rede através do machine learning. A transição da engenharia de software para o machine learning foi impulsionada pelo desejo de enfrentar desafios mais complexos e em evolução. Como Harsh observa, o campo do machine learning não é apenas rigoroso, mas também dinâmico, oferecendo oportunidades contínuas de aprendizado e inovação.

Operações Semanais: Enfrentando Desafios de Cibersegurança

O papel de Harsh na Palo Alto Networks envolve abordar vários desafios de cibersegurança através do machine learning. As operações semanais são estruturadas em torno do monitoramento contínuo da atividade de rede, identificando ameaças potenciais e desenvolvendo modelos que podem prever e prevenir essas ameaças.

Harsh enfatiza a importância do processamento em tempo real e em lote nessas operações. Enquanto o processamento em tempo real é crucial para a detecção imediata de ameaças, o processamento em lote permite a análise de tendências de dados de longo prazo, ajudando a refinar modelos e aprimorar futuras capacidades de detecção de ameaças.

Processamento em Tempo Real vs. em Lote: Uma Abordagem Equilibrada

A eficácia da aprendizagem automática em cibersegurança depende muito da forma como os dados são processados. Na Palo Alto Networks, uma combinação de processamento em tempo real e em lote é utilizada para gerir dados e obter informações.

Processamento em Tempo Real: Isto é essencial para a deteção imediata de ameaças. Por exemplo, se um utilizador aceder a um website potencialmente malicioso, o sistema precisa de responder instantaneamente para evitar qualquer falha de segurança. O processamento em tempo real garante que os modelos de aprendizagem automática estão a analisar continuamente os fluxos de dados de entrada e a sinalizar qualquer atividade suspeita.
Processamento em Lote: O processamento em lote é utilizado para analisar dados durante períodos mais longos, como a identificação de potenciais ameaças com base em registos de tráfego dos últimos 30 dias. Esta abordagem permite que o sistema detete padrões que podem não ser imediatamente aparentes na análise em tempo real. Por exemplo, se um tipo específico de tráfego acionar consistentemente alertas, o processamento em lote pode ajudar a compreender se se trata de uma nova ameaça ou de um falso positivo.

A combinação destes dois métodos de processamento garante que as soluções de segurança da Palo Alto Networks são simultaneamente responsivas e completas, capazes de abordar ameaças imediatas e, ao mesmo tempo, aprender com dados históricos.

Construção e Implementação de Modelos de Aprendizagem Automática

O desenvolvimento de modelos de aprendizagem automática na Palo Alto Networks segue um pipeline bem estruturado, desde a ingestão de dados até à implementação e disponibilização do modelo. Harsh descreve os passos chave neste processo:

Ingestão e Pré-processamento de Dados: O primeiro passo envolve a recolha e limpeza dos dados. Esta é uma fase crucial, pois a qualidade dos dados impacta diretamente o desempenho dos modelos de aprendizagem automática. A ingestão de dados pode envolver o streaming de dados de várias fontes, como registos de rede ou registos de utilização de software.
Engenharia de Características: Uma vez que os dados são ingeridos, o próximo passo é projetar características significativas que possam ser usadas para treinar os modelos. Isso pode envolver a transformação de dados brutos em formatos que o modelo possa interpretar facilmente, como a conversão de dados de registo em características numéricas.
Treino de Modelos: Com as características preparadas, os modelos de aprendizagem automática são treinados utilizando grandes conjuntos de dados. O treino pode envolver a utilização de uma mistura de algoritmos tradicionais de aprendizagem automática e avanços mais recentes, como modelos de linguagem grandes (LLMs) para tarefas específicas.
Implementação de Modelos: Após o treino, os modelos são implementados num ambiente de produção onde podem analisar dados em tempo real. A implementação envolve a configuração dos modelos para que possam ser acedidos por vários sistemas em tempo real.
Disponibilização de Modelos: Finalmente, os modelos implementados são disponibilizados aos clientes, fornecendo-lhes as informações e alertas necessários para manter uma cibersegurança robusta. Isso pode envolver a integração dos modelos com plataformas de segurança existentes ou a criação de novas ferramentas que aproveitem as previsões dos modelos.

A Pilha Tecnológica: Ferramentas e Plataformas

A Palo Alto Networks emprega uma pilha tecnológica diversificada para apoiar as suas iniciativas de aprendizagem automática. Isso inclui ferramentas para processamento de dados, treino de modelos e implementação:

Processamento de Dados: A empresa utiliza Apache Spark para processar grandes volumes de dados. A capacidade do Spark de lidar com cargas de trabalho de big data o torna ideal para os tipos de tarefas em lote que a Palo Alto Networks executa, como processamento de logs de tráfego ou análise de dados históricos para padrões de ameaças.
Plataformas de Streaming: Para a ingestão de dados em tempo real, são utilizadas plataformas como Apache Kafka e Google Pub/Sub. Essas ferramentas permitem o fluxo contínuo de dados de diversas fontes, garantindo que os modelos de aprendizado de máquina tenham as informações mais atualizadas.
Serviços em Nuvem: Os modelos de aprendizado de máquina na Palo Alto Networks são frequentemente treinados e implantados usando plataformas em nuvem como Google Cloud Platform (GCP) e Amazon Web Services (AWS). Essas plataformas oferecem serviços gerenciados como Google DataProc para a execução de tarefas Spark e Amazon SageMaker ou Google Vertex AI para treinamento e implantação de modelos.
Soluções de Armazenamento: O armazenamento de dados é gerenciado por uma combinação de serviços, dependendo dos requisitos do projeto. Isso inclui o uso de buckets S3 ou GCS para armazenamento de dados brutos, BigQuery para análise de dados e feature stores dedicados para armazenar recursos engenheirados.
Plataformas de Machine Learning: Para o gerenciamento e implantação de modelos, são empregadas plataformas como SageMaker e Vertex AI. Essas plataformas oferecem ambientes integrados para a construção, treinamento e implantação de modelos de aprendizado de máquina em escala.

A Integração da IA Generativa

À medida que o campo do aprendizado de máquina evolui, a Palo Alto Networks começou a integrar a IA generativa em suas soluções de cibersegurança. A IA generativa, especialmente os modelos de linguagem grandes, oferece novas possibilidades para a detecção e resposta a ameaças. Esses modelos podem ser usados para gerar previsões ou simular cenários de ameaças potenciais, fornecendo insights mais profundos sobre como prevenir violações de segurança.

Harsh menciona que, embora os modelos tradicionais de aprendizado de máquina ainda sejam a espinha dorsal das soluções de cibersegurança da Palo Alto Networks, a integração da IA generativa é um desenvolvimento empolgante. Ao utilizar tanto modelos clássicos de ML quanto a IA generativa moderna, a empresa é capaz de aprimorar suas capacidades de detecção de ameaças, oferecendo soluções de segurança mais abrangentes aos seus clientes.

Desafios e Direções Futuras

A integração do aprendizado de máquina na cibersegurança não está isenta de desafios. Uma das principais dificuldades é garantir que os modelos permaneçam eficazes à medida que o cenário de ameaças evolui. As ameaças de cibersegurança estão em constante mudança, e os modelos de aprendizado de máquina devem ser continuamente atualizados para reconhecer novos padrões de comportamento malicioso.

Outro desafio é o equilíbrio entre processamento em tempo real e processamento em lote. Embora a análise em tempo real seja crucial para a detecção imediata de ameaças, ela pode ser intensiva em recursos. Por outro lado, o processamento em lote é menos exigente, mas pode perder ameaças em tempo real. A Palo Alto Networks aborda isso utilizando uma abordagem híbrida, combinando os pontos fortes de ambos os métodos.

Olhando para o futuro, a Palo Alto Networks visa continuar inovando no espaço da cibersegurança. Isso inclui a maior integração da IA generativa e a expansão do uso do aprendizado de máquina em diferentes plataformas de segurança. Ao se manter na vanguarda da tecnologia, a empresa espera permanecer líder no fornecimento de soluções de cibersegurança robustas e escaláveis.

TrueFoundry AI Gateway delivers ~3–4 ms latency, handles 350+ RPS on 1 vCPU, scales horizontally with ease, and is production-ready, while LiteLLM suffers from high latency, struggles beyond moderate RPS, lacks built-in scaling, and is best for light or prototype workloads.

Built for Speed: ~10ms Latency, Even Under Load

Schedule your Demo Now