Я запустил Googles Bigquery в Архиве Github и просмотрел 332 миллиона push-событий github (прошло 51,5 секунды, обработано 31,5 ГБ) в публичные репозитории с февраля 2011 года.

Каждый вклад изначально выглядит как новый, поскольку в Архиве нет данных о том, кто внес свой вклад до 12 февраля 2011 года, но эффект быстро исчезает, и мы видим довольно здоровую кривую роста.

Самая ошеломляющая статистика - это среднее количество около шести тысяч НОВЫХ людей, загружающих код в github каждый день. По сути

Больше НОВЫХ людей загружают код на github за неделю, чем в США получают диплом по информатике за год!

Если мы посмотрим на количество пушей и репозиториев, они, тем не менее, растут в значительной степени рука об руку:

Это означает, что большинство людей нажимают только на очень небольшое количество репозиториев. Фактически, среднее количество репозиториев, в которое вносит свой вклад каждый пользователь, составляет всего 1,05.

Учитывая все домашние задания Coursera, я думаю, это ожидаемо, но часть меня надеялась в среднем на большее сотрудничество.

Я ухватился за это в надежде узнать что-нибудь об изменении географии git push для Teleport, но похоже, что ребята из архива Github не сделали доступным поле местоположения в истории push. Учитывая избыточность, я, конечно, могу их понять, но разве это не круто….

Может быть, вы поможете мне привлечь их внимание наизусть, прочитав этот пост, или, может быть, кто-то захочет раздвинуть пределы github api для запросов о местоположении? ;)

Ссылки:

  1. Https://github.com/
  2. Https://www.githubarchive.org/
  3. Http://www.geekwire.com/2014/analysis-examining-computer-science-education-explosion/
  4. Https://cloud.google.com/bigquery/