Se você está construindo ou dimensionando uma infraestrutura de IA agora, provavelmente se deparou com o mesmo obstáculo: as decisões de armazenamento de dados que você tomou há três anos não foram projetadas para o que os pipelines de IA realmente exigem. Os dados não estruturados estão crescendo mais rápido do que a maioria das arquiteturas de armazenamento legadas conseguem absorvê-los, e a lacuna entre o que sua plataforma prometeu e o que ela pode realmente entregar em escala torna-se muito visível, muito rapidamente.
Reunimos três análises recentes de terceiros sobre Dell PowerScale para ver o que os profissionais estão vivenciando em ambientes de produção. Estas não são declarações de posicionamento – são feedback real de engenheiros de armazenamento e líderes de TI que gerenciam armazenamento de IA e cargas de trabalho de armazenamento NAS em grande escala em campo.
Escalabilidade para o crescimento de pipelines de dados de IA
Um engenheiro de sistemas explica a história da escalabilidade em termos concretos que qualquer líder de TI que gerencia volumes crescentes de dados reconhecerá: “O benefício do Dell PowerScale (Isilon) para nossa organização é a escalabilidade. Começamos com um sistema bem pequeno de um cluster de 32 nós e depois o construímos para 88 nós. Para nós, isso nos permitiu passar de vários petabytes para 10 petabytes mais petabytes naquele cluster.”
Do cluster de 32 nós ao cluster de 88 nós. De vários petabytes a mais de 10 petabytes de capacidade — em um único cluster PowerScale. Esse tipo de crescimento sem interrupções é exatamente o que os pipelines de dados de IA exigem. Quando seus conjuntos de dados de treinamento, resultados de modelos e cargas de trabalho de inferência estão se expandindo continuamente, a última coisa que você precisa é de uma arquitetura de armazenamento que force uma atualização em grande escala sempre que você atingir um limite máximo. O design escalável do PowerScale significa que você adiciona capacidade e desempenho juntos, sem reconstruir o que já está funcionando.
Para organizações que estão criando ou expandindo uma fábrica de IA, a escalabilidade do PowerScale não é algo agradável de se ter. Essa escalabilidade é a base sobre a qual a infraestrutura de armazenamento de IA funciona.
Um conjunto de recursos para cargas de trabalho complexas e não estruturadas
Um engenheiro de serviços profissionais oferece uma das avaliações profissionais mais abrangentes que você encontrará em qualquer fórum de revisão por pares: “O Dell PowerScale (Isilon) ajuda a melhorar o modo como a organização funciona por meio de escalabilidade massiva, alto desempenho, um sistema de arquivos único, alta disponibilidade e confiabilidade, protocolos flexíveis, suporte para NFS, SMB, HDFS, segurança forte, integração na nuvem, eficiência, proteção de dados, snapshot, fila e fila de sincronização, otimizados para dados não estruturados.”
Na prática, isso revela várias propriedades importantes:
- Escalabilidade massiva
- Alto desempenho
- Um único sistema de arquivos para todo o cluster
- Alta disponibilidade e confiabilidade
- Suporte flexível e multiprotocolo (NFS, SMB, HDFS e S3/objeto)
- Recursos de segurança
- Integração em nuvem para ambientes híbridos e multicloud
- Eficiência e proteção de dados por meio de snapshots e serviços de sincronização/replicação
- Otimização para dados não estruturados em escala
Essa lista não é acidental – ela reflete o que os ambientes modernos de armazenamento de IA e de armazenamento em nuvem híbrida realmente exigem. O suporte multiprotocolo em NFS, SMB e HDFS significa que o PowerScale se adapta a diversas pilhas de infraestrutura sem forçar a padronização em torno de um único fluxo de trabalho. A arquitetura do sistema de arquivos único simplifica o gerenciamento em um cenário de dados fragmentado. E para organizações que executam estratégias de armazenamento multicloud, os recursos de integração em nuvem significam que seu armazenamento NAS local não se torna uma ilha.
O revisor também destaca as melhorias na interface do usuário e a flexibilidade de licenciamento – duas coisas que não aparecem nas folhas de especificações, mas são extremamente importantes para os engenheiros que vivem nessas plataformas todos os dias.
Confiabilidade e proteção de dados em escala
Um engenheiro de plataforma de armazenamento se aprofunda na aparência da confiabilidade nos bastidores: “Em termos de estabilidade e confiabilidade, eu daria nota dez. A forma como escrevemos nossos dados no Dell PowerScale (Isilon) utiliza um plano de proteção que permite a manutenção de dois a três blocos de seus dados em todos os nós. Mesmo que um nó fique inativo, outros nós podem responder e fornecer dados de volta ao usuário sem problemas e, embora possam haver falhas de hardware, elas são raras.”
Isso destaca várias características importantes:
- Uma classificação de estabilidade de 10/10 de um engenheiro de armazenamento que entende da arquitetura.
- Um plano de proteção distribuído que armazena vários blocos ou cópias de dados entre nós.
- Disponibilidade contínua de dados mesmo se nós individuais falharem.
- Falhas de hardware são raras e, quando ocorrem, o cluster continua a fornecer dados.
Esse é um sinal significativo. Para cargas de trabalho de IA em particular – onde uma execução de treinamento com falha ou um pipeline de dados interrompido pode significar horas de perda de tempo de computação – o modelo de proteção distribuída que o PowerScale usa não é apenas um recurso de confiabilidade. É um recurso de continuidade de negócios. Os dados permanecem disponíveis nos nós mesmo quando o hardware falha, o que significa que seus pipelines de IA continuam em movimento mesmo quando a infraestrutura não coopera perfeitamente.
O que isso significa para sua avaliação
Estas três revisões apontam para a mesma conclusão de três ângulos diferentes: Dell PowerScale foi desenvolvido para atender às demandas de escala, complexidade e confiabilidade que as cargas de trabalho modernas de armazenamento de IA exigem:
- O Dell PowerScale pode escalar sem interrupções, desde dezenas de nós até clusters muito maiores.
- PowerScale unifica o armazenamento de arquivos e objetos em uma única plataforma.
- PowerScale oferece suporte a diversos protocolos, como NFS, SMB, HDFS e S3/Object.
- Os engenheiros de armazenamento avaliam muito a confiabilidade do PowerScale e descrevem como ele mantém a disponibilidade dos dados durante falhas de nós.
Juntamente com o portfólio mais amplo de fábrica de IA da Dell – abrangendo armazenamento totalmente flash, infraestrutura NVMe e integração de armazenamento multicloud – o PowerScale oferece aos líderes de TI uma base de armazenamento de dados projetada para onde a infraestrutura de IA está indo, e não apenas para onde ela esteve.
Se você está avaliando o armazenamento NAS ou o armazenamento unificado de arquivos e objetos para cargas de trabalho de IA, insights de pares como esses têm um peso que os resumos do produto por si só não conseguem replicar. Eles informam o que a plataforma realmente faz quando as cargas de trabalho e os volumes de dados atingem a escala do mundo real.
Como mostram essas análises por pares, o PowerScale foi desenvolvido para a escala, a confiabilidade e a realidade operacional que os pipelines de dados de IA exigem. É por isso que está no centro do Plataforma de dados de IA da Dell—fornecendo uma base de arquivos resiliente e de alto rendimento que mantém as cargas de trabalho de IA em execução à medida que os volumes de dados e a complexidade aumentam. Para fábricas de IA, é da camada de armazenamento da qual tudo o mais depende.
Informou a Dell.
Fonte: www.dell.com
Link da Fonte
