Je commence tout juste à configurer SGE (Sun Grid Engine) pour le cluster.
J’ai deux Node1 et Node2 de cluster,
Chaque nœud a 24vCPU et 240 Go de RAM.
Le problème est que je n’utilise pas complètement la mémoire (environ 8%) et le processeur (environ 30%)
Même si j’augmente le fil du programme, il ressemble à chaque fois à la même ressource.
Je veux savoir s’il y a de toute façon plus de mémoire et de CPU flexible? Et aussi quel est le sharepoint départ de cet accord.
Je soumets comme ci-dessous,
qsub -l mem_free=200GB -pe olcd 20 test.sh
J’ai utilisé qstat -f -j $ jobid. et obtenir ça
parallel environment: olcd range: 20 usage 1: cpu=04:47:12, mem=30523.46624 GBs, io=0.13225, vmem=505.098M, maxvmem=3.927
Cela ressemble à un seul processeur est utilisé bien que je configure le slot comme 20.
Je dois améliorer la performance au moins pour trouver le meilleur temps de fonctionnement.
Quelqu’un at-il une bonne idée de configurer ce moteur Sun Grid? Merci
Les slots que vous réservez avec qsub, c’est-à-dire via l’option -pe olcd 20
, ne reflètent pas ce qui est réellement utilisé par le système. Même idée pour la mémoire, mem_free=200GB
.
Le seul effet de qsub / SGE est de réserver ces ressources au nom du travail. C’est à la tâche de consumr ces ressources.
Cela étant dit, le travail que vous soumettez est-il censé utiliser 20 threads et 200 Go de RAM?