Для обработки результатов мне нужно определить аллельное разнообразие определённых локусов ДНК в геномах бактерий. Из литературы нашёл несколько формул
h= 1 – сумма(X(i)*X(i))[n/(n-1)]
h= 1 – сумма(X(i)*X(i))
h= 1 – сумма(X(i)*X(i))[n/n-1]
где X(i) – частота i-го аллеля, а n-количество штаммов. Ну, вроде третья отпадает, похоже на опечатку, а где применяются первые две? И ещё, если полиморфизма нет вообще, то индекс по первой получается вообще отрицательный. Это нормально?
Или может считать нужно вообще по другому?


