Я запустил Googles Bigquery в Архиве Github и просмотрел 332 миллиона push-событий github (прошло 51,5 секунды, обработано 31,5 ГБ) в публичные репозитории с февраля 2011 года.
Каждый вклад изначально выглядит как новый, поскольку в Архиве нет данных о том, кто внес свой вклад до 12 февраля 2011 года, но эффект быстро исчезает, и мы видим довольно здоровую кривую роста.
Самая ошеломляющая статистика - это среднее количество около шести тысяч НОВЫХ людей, загружающих код в github каждый день. По сути
Больше НОВЫХ людей загружают код на github за неделю, чем в США получают диплом по информатике за год!
Если мы посмотрим на количество пушей и репозиториев, они, тем не менее, растут в значительной степени рука об руку:
Это означает, что большинство людей нажимают только на очень небольшое количество репозиториев. Фактически, среднее количество репозиториев, в которое вносит свой вклад каждый пользователь, составляет всего 1,05.
Учитывая все домашние задания Coursera, я думаю, это ожидаемо, но часть меня надеялась в среднем на большее сотрудничество.
Я ухватился за это в надежде узнать что-нибудь об изменении географии git push для Teleport, но похоже, что ребята из архива Github не сделали доступным поле местоположения в истории push. Учитывая избыточность, я, конечно, могу их понять, но разве это не круто….
Может быть, вы поможете мне привлечь их внимание наизусть, прочитав этот пост, или, может быть, кто-то захочет раздвинуть пределы github api для запросов о местоположении? ;)
Ссылки: