Bioinformática
A plataforma multiusuário de bioinformática do INCA conta com uma infraestrutura de computação de alto desempenho para apoiar projetos de pesquisa que envolvam técnicas de bioinformática para análise de dados de biologia molecular, genômica e proteômica.
Nosso cluster para computação de alto desempenho (High Performance Computing Cluster - HPCC) nomeado Crab (HPCC-Crab) é utilizado por pesquisadores, alunos e colaboradores do INCA no desenvolvimento de seus projetos. Em 2018 essa plataforma foi extendida, com a aquisição de novos equipamentos Dell Technologies através do suporte da FINEP. A plataforma também mantém um servidor dedicado para desenvolvimento no ambiente R-Studio em interface WEB e um computador SGI dedicado a projetos que requeiram alta capacidade de computação combinada com uso intenso de memória RAM.
Responsável pela plataforma:
Nicole de Miranda Scherer (Lattes)
Tecnologista
Email: nscherer@inca.gov.br
Telefone: +55 21 32076546
Lista de equipamentos:
- HPCC-Crab: o HPC cluster Crab possui diversos componentes Dell Technologies que juntos formam a solução completa de computação de alto desempenho, habilitada para executar diversas aplicações de bioinformática. São 40 unidades de processamento (24 com 128 GB ou 16 com 64GB de memória RAM), que podem se usadas em cluster para processos paralelos MPI, e uma unidade de alta capacidade de processamento e 3TB de memória RAM. O Crab foi construído pensando em performance e também em segurança, capacidade de alta disponibilidade e aproveitamento de recursos: há dois servidores de acesso e submissão (headnode) em alta disponibilidade e quatro servidores para gerenciamento do armazenamento (storage nodes). O sistema operacional dos servidores do cluster é GNU/Linux, distribuição CentOS 7.5, provisionado via Bright Computing. A alocação dos recursos computacionais é requisitada através do gerenciador de filas e agendador de tarefas Slurm Workload Manager (gestor de carga de trabalho). As unidades de processamento estão equipadas com interconexão padrão InfiniBand para processamento paralelo (Bit rate 40Gbps).
- Lobster: servidor Dell PowerEdge 820xd dedicado ao desenvolvimento de análises com R na interface R-Studio, oferece 256 GB de memória RAM e é integrado ao HPCC-Crab, com acesso ao armazenamento compartilhado e possibilidade de submissão de jobs pelo SLURM.
- Siri: super computador SGI UV-2000, usado prioritariamente para análise de genomas e outras tarefas com alta demanda de memória e processamento. Utiliza sistema operacional Linux, distribuição CentOS7, sem gestor de carga de trabalho.
Utilização:
Para ter acesso aos recursos da plataforma, os pesquisadores devem solicitar o cadastramento de projetos e usuários por email para contatohpc@inca.gov.br.
Instruções para acesso a dados do TCGA
Localização:
Instituto Nacional de Câncer
Coordenação de Pesquisa e Inovação
Rua André Cavalcanti, 37, 1º andar
Centro, Rio de Janeiro
CEP: 20231-050