게시일: 2021-10-27
안녕하세요.
gmunu 서버에서 openmpi를 (openmp 아님) 사용할 시에 srun으로 작업을 실행하면 노드 한개만 실행되는 현상이 발견되었습니다. 이는 openmpi가 잡 스케줄러 slrum을 사용할 시에 pmi를 사용하기 때문에 pmi 옵션을 넣어주지 않아서 발생하는 문제임을 찾아내었습니다. 따라서 openmpi로 MPI작업을 할 경우 실행 명령어를 아래와 같이 실행 해 주시길 바랍니다.
srun --mpi=pmi2 ./MPI(+openmp)_job_executable
추후 다른 MPI에서도 문제가 되는지 확인 하도록 하겠습니다.