У меня есть переменная var
со многими пропущенными значениями, для которых я хочу вычислить 95-й процентиль, а затем использовать это значение, чтобы отбросить наблюдения, которые лежат выше 95-го процентиля (для тех наблюдений, которые не пропускают переменную).
Из-за множества отсутствующих значений я использую egen
с rowpctile
, который должен вычислять p(#)
процентиль, игнорируя отсутствующие значения. Однако когда я смотрю на значения p95, они представляют собой диапазон разных значений, а не одно значение 95-го процентиля, как показано ниже:
. egen p95 = rowpctile(var), p(95)
. list p95
+-----------+
| p95 |
|-----------|
1. | . |
2. | 65.71429 |
3. | 14.28571 |
4. | . |
5. | . |
...
Я неправильно использую функцию или есть способ лучше?