<div dir="ltr"><div dir="ltr"><br></div><div class="gmail_quote"><blockquote class="gmail_quote" style="margin:0px 0px 0px 0.8ex;padding-left:1ex;border-left-color:rgb(204,204,204);border-left-width:1px;border-left-style:solid">---------- Forwarded message ----------<br>From: Willem Ferguson <<a href="mailto:willemferguson@zoology.up.ac.za" target="_blank">willemferguson@zoology.up.ac.za</a>><br>To: Subsurface Mailing List <<a href="mailto:subsurface@subsurface-divelog.org" target="_blank">subsurface@subsurface-divelog.org</a>><br>Cc: <br>Bcc: <br>Date: Thu, 14 May 2020 21:04:14 +0200<br>Subject: Fwd: Re: RFC: Statistics in Subsurface<br><br>….snip....<br>
I attach a suggestion that, to me, what it does is to actually plot the <br>
raw data points and show what the mean value for each dataset is (red <br>
bar). This is much more usable than a mere report of min, mean, max. For <br>
instance, for the wetsuit dataset, the bottom two points are probably <br>
outliers (possibly erroneous cylinder pressures or cylinder type entered <br>
into the dive log?) and one might consider not using these to interpret <br>
the data. For wetsuit, it appears that SAC mostly varies between 13 and <br>
21, and that the min and max values indicated are not necessarily so <br>
useful. For the semidry suit data, the data points are much more <br>
cohesive and the min and max values plotted are possibly more useful. It <br>
depends on the person looking at the graph to use the min and max as <br>
plotted, or to use some other way of interpretation. This would provide <br>
a good impression of the distribution of the SAC data for each suit type <br>
and still provide mean, max and min values. And I think most persons <br>
should be able to interpret the diagram easily?<br></blockquote><div><br></div><div>I know this plot as a 'beeswarm'.  I'm not sure if that's a universally used term, but I use those in Spotfire (a large statistics tool).  I thought I should show the same type of plot that contains a bit more data, because it changes the view somewhat.  So here's a collection of data with more than 100 data points, categorized 7 different ways.  I've cut out the labels because this isn't data extracted from anything remotely associated with diving.</div><div><div><img width="386" height="266" alt="image.png" src="cid:ii_ka77913e0"></div><div><br></div><div>Is this clear to people?  I love beeswarm for my job. I do find these tend to balloon outwards (in width) as the data population increases.  </div><div><br></div><div>I'm not sure beeswarm is so clear to the average diver, but maybe I underestimate the userbase.  </div><div><br></div><div>...Hartley<br></div></div><blockquote class="gmail_quote" style="margin:0px 0px 0px 0.8ex;padding-left:1ex;border-left-color:rgb(204,204,204);border-left-width:1px;border-left-style:solid">
</blockquote></div></div>