Для обработки результатов мне нужно определить аллельное разнообразие определённых локусов ДНК в геномах бактерий. Из литературы нашёл несколько формул

h= 1 – сумма(X(i)*X(i))[n/(n-1)]

h= 1 – сумма(X(i)*X(i))

h= 1 – сумма(X(i)*X(i))[n/n-1]

где X(i) – частота i-го аллеля, а n-количество штаммов. Ну, вроде третья отпадает, похоже на опечатку, а где применяются первые две? И ещё, если полиморфизма нет вообще, то индекс по первой получается вообще отрицательный. Это нормально?

Или может считать нужно вообще по другому?