<HTML>
<HEAD>
<TITLE>Re: [Pw_forum] Insufficient Virtual Memory</TITLE>
</HEAD>
<BODY>
<FONT SIZE="4"><FONT FACE="Calibri, Verdana, Helvetica, Arial"><SPAN STYLE='font-size:11pt'>Dear Axel,<BR>
<BR>
Thanks for clarification.<BR>
<BR>
About the benchmarks, I just simply to see how well is the performance of &nbsp;the cluster we bought in term of scaling with QE. &nbsp;I sent some plots to you, but the email did not go thru because of the restriction of the size (larger than 40K).<BR>
<BR>
Currently, I am not happy at the fact that the difference in CPU time and wall time is too large. &nbsp;&nbsp;&nbsp;&nbsp;</SPAN></FONT><FONT FACE="Consolas, Courier New, Courier"><SPAN STYLE='font-size:10pt'>When I run a longer job, which took ~2h CPU time long, the wall time was ~7h when I run from the head node, and ~4h when I run from another node, which is not the head node. &nbsp;The reason why I avoided running from the head node was that other users might use the head node to do their work, causing the long wall time. &nbsp;Even when I did the test runs (short runs), when no one used the cluster, the difference was still up to 25%, depending on how many nodes I used. I do not know what I should do to improve this difference. According to you, what should I look at to fix the problem. (I also need to read the forum discussion as Lorenzo said in his email). &nbsp;&nbsp;<BR>
<BR>
Thanks,<BR>
<BR>
Trinh<BR>
</SPAN></FONT><FONT FACE="Calibri, Verdana, Helvetica, Arial"><SPAN STYLE='font-size:11pt'><BR>
On 2/26/09 4:34 PM, &quot;Axel Kohlmeyer&quot; &lt;akohlmey@cmm.chem.upenn.edu&gt; wrote:<BR>
<BR>
</SPAN></FONT></FONT><BLOCKQUOTE><FONT SIZE="4"><FONT FACE="Calibri, Verdana, Helvetica, Arial"><SPAN STYLE='font-size:11pt'>On Thu, 26 Feb 2009, Vo, Trinh wrote:<BR>
<BR>
TV&gt; Dear Axel,<BR>
TV&gt;<BR>
<BR>
TV&gt; I am sorry. &nbsp;I may be out of date. &nbsp;Is the cp2k code included in QE<BR>
TV&gt; package, or in some other codes? &nbsp;I saw the word &quot;cp2k&quot; in the title<BR>
<BR>
perhaps i was not clear enough. cp2k is a completely different project<BR>
and has not much else to do with Q-E outside of the fact that both<BR>
have a DFT module and that i and a few others are using both codes.<BR>
<BR>
TV&gt; of the plot, but I thought that it might be the same cp code of QE. <BR>
<BR>
no. i already wrote that. in fact, &quot;there is no CP in CP2k&quot;.<BR>
i suggested this phase as a subtitle to the project, but people<BR>
found it to negative. ;)<BR>
<BR>
TV&gt; Actually, the benchmark plot that I obtained does not look as good<BR>
TV&gt; as the posted plot. &nbsp;I will send it to you in the next email. I need<BR>
TV&gt; to make a better plot before I send it.<BR>
<BR>
benchmark in terms of scaling or in terms of problem set size?<BR>
<BR>
there should be a post in the cp2k google group referring to the<BR>
benchmark graph and describing the exact system setup.<BR>
<BR>
cheers,<BR>
&nbsp;&nbsp;&nbsp;axel.<BR>
<BR>
TV&gt;<BR>
TV&gt; Thanks,<BR>
TV&gt;<BR>
TV&gt; Trinh<BR>
TV&gt;<BR>
TV&gt; <BR>
TV&gt; TV&gt; tried to repeat all the calculations to compare, but I could not run<BR>
TV&gt; TV&gt; that case.<BR>
TV&gt;<BR>
TV&gt; this graph was done with a _very_ different code, cp2k, that<BR>
TV&gt; uses a method (quickstep) different from the CP in cp.x and has<BR>
TV&gt; therefore different memory requirements and system size scaling.<BR>
TV&gt; the README of example21 explicitly warns you about running out<BR>
TV&gt; of memory. give the current difference in speed between hard<BR>
TV&gt; drives and main memory, every calculation where you run into<BR>
TV&gt; using swap is not worth the effort (unlike 10 years ago).<BR>
TV&gt;<BR>
TV&gt; just for reference: because of the difference in methods cp.x<BR>
TV&gt; should scale better with the number of processors, whereas<BR>
TV&gt; cp2k should scale better with the problem set size than cp.x<BR>
TV&gt; with the same number of processors.<BR>
TV&gt;<BR>
TV&gt; that being said, cp2k demonstrates the problem of overloading<BR>
TV&gt; memory and communication channels very nicely and thus the<BR>
TV&gt; graphs are a nice point of reference to showcase how bad it<BR>
TV&gt; can get and that the not so obvious choice of not using all<BR>
TV&gt; cpus actually gives you the better performance.<BR>
TV&gt;<BR>
TV&gt; cheers,<BR>
TV&gt; &nbsp;&nbsp;&nbsp;axel.<BR>
TV&gt;<BR>
TV&gt; TV&gt;<BR>
TV&gt; TV&gt; Thank you,<BR>
TV&gt; TV&gt;<BR>
TV&gt; TV&gt; Trinh &nbsp;&nbsp;<BR>
TV&gt; TV&gt;<BR>
TV&gt; TV&gt;<BR>
TV&gt; TV&gt;<BR>
TV&gt; TV&gt; -----Original Message-----<BR>
TV&gt; TV&gt; From: pw_forum-bounces@pwscf.org [<a href="mailto:pw_forum-bounces@pwscf.org]">mailto:pw_forum-bounces@pwscf.org]</a> On Behalf Of Axel Kohlmeyer<BR>
TV&gt; TV&gt; Sent: Thursday, February 26, 2009 1:04 PM<BR>
TV&gt; TV&gt; To: PWSCF Forum<BR>
TV&gt; TV&gt; Subject: Re: [Pw_forum] Insufficient Virtual Memory<BR>
TV&gt; TV&gt;<BR>
TV&gt; TV&gt; On Thu, 26 Feb 2009, Vo, Trinh wrote:<BR>
TV&gt; TV&gt;<BR>
TV&gt; TV&gt; TV&gt; Dear PWSCF users,<BR>
TV&gt; TV&gt; TV&gt;<BR>
TV&gt; TV&gt; TV&gt; I was running a benchmark (using example21 in QE) for my computer cluster (total 18 nodes) to compare the results with those posted on web link that was mentioned by Axel in some previous forum emails..<BR>
TV&gt; TV&gt; TV&gt;<BR>
TV&gt; TV&gt; TV&gt; When I performed the calculation for the case of 512 H2O with 4cores/node, the job crashed with the error:<BR>
TV&gt; TV&gt; TV&gt;<BR>
TV&gt; TV&gt; TV&gt; &nbsp;&quot;forrtl: severe (41): insufficient virtual memory&quot;.<BR>
TV&gt; TV&gt; TV&gt;<BR>
TV&gt; TV&gt;<BR>
TV&gt; TV&gt; TV&gt; I do not know how to deal with this. &nbsp;Any help or suggestion is<BR>
TV&gt; TV&gt; TV&gt; appreciated. &nbsp;For other cases, the runs were fine.<BR>
TV&gt; TV&gt;<BR>
TV&gt; TV&gt; have you _read_ the README file in that directory???<BR>
TV&gt; TV&gt;<BR>
TV&gt; TV&gt; axel.<BR>
TV&gt; TV&gt;<BR>
TV&gt; TV&gt;<BR>
TV&gt; TV&gt; TV&gt;<BR>
TV&gt; TV&gt; TV&gt; Below are the specifications of my cluster:<BR>
TV&gt; TV&gt; TV&gt;<BR>
TV&gt; TV&gt; TV&gt; Intel CPU Xeon X5450 Quad Core 3.0GHz with 12M cache 133MHz FSB<BR>
TV&gt; TV&gt; TV&gt; DDRII667 4GB RAM FBD ECC (D-667D2D4F5/4GB)<BR>
TV&gt; TV&gt; TV&gt;<BR>
TV&gt; TV&gt; TV&gt; For compilation, I used the following:<BR>
TV&gt; TV&gt; TV&gt; QE ver. 4.0.3<BR>
TV&gt; TV&gt; TV&gt; ifort 10.1015, MKL &nbsp;10.0.3.020, impi 3.1<BR>
TV&gt; TV&gt; TV&gt; internal fftw<BR>
TV&gt; TV&gt; TV&gt;<BR>
TV&gt; TV&gt; TV&gt; I also attach here the output file.<BR>
TV&gt; TV&gt; TV&gt;<BR>
TV&gt; TV&gt; TV&gt;<BR>
TV&gt; TV&gt; TV&gt; Thank you,<BR>
TV&gt; TV&gt; TV&gt;<BR>
TV&gt; TV&gt; TV&gt; Trinh Vo<BR>
TV&gt; TV&gt; TV&gt;<BR>
TV&gt; TV&gt; TV&gt;<BR>
TV&gt; TV&gt; TV&gt;<BR>
TV&gt; TV&gt; TV&gt;<BR>
TV&gt; TV&gt; TV&gt;<BR>
TV&gt; TV&gt;<BR>
TV&gt; TV&gt;<BR>
TV&gt;<BR>
TV&gt;<BR>
<BR>
--<BR>
=======================================================================<BR>
Axel Kohlmeyer &nbsp;&nbsp;akohlmey@cmm.chem.upenn.edu &nbsp;&nbsp;<a href="http://www.cmm.upenn.edu">http://www.cmm.upenn.edu</a><BR>
&nbsp;&nbsp;&nbsp;Center for Molecular Modeling &nbsp;&nbsp;-- &nbsp;&nbsp;University of Pennsylvania<BR>
Department of Chemistry, 231 S.34th Street, Philadelphia, PA 19104-6323<BR>
tel: 1-215-898-1582, &nbsp;fax: 1-215-573-6233, &nbsp;office-tel: 1-215-898-5425<BR>
=======================================================================<BR>
If you make something idiot-proof, the universe creates a better idiot.<BR>
_______________________________________________<BR>
Pw_forum mailing list<BR>
Pw_forum@pwscf.org<BR>
<a href="http://www.democritos.it/mailman/listinfo/pw_forum">http://www.democritos.it/mailman/listinfo/pw_forum</a><BR>
<BR>
</SPAN></FONT></FONT></BLOCKQUOTE>
</BODY>
</HTML>