Публикации по теме 'bigquery'


Гигиена OSS на GitHub: масштабное отслеживание ошибок безопасности с помощью больших данных
Еще в марте, когда я работал над новым API для личного пет-проекта, я наткнулся на ошибку, которая заставляла меня обрабатывать терабайты исходного кода и открывать проблемы почти в сотне проектов GitHub, пытаясь сдержать ее. Мой API использует UUID версии 4 для именования некоторых файлов, которые генерируются моим процессором. Идея состоит в том, что, поскольку UUID уникальны для всех, я могу генерировать их локально на рабочих узлах моего кластера без какой-либо синхронизации..

5 полезных советов, как изменить работу с BigQuery
Советы, которые изменили правила игры. Я бы хотел, чтобы кто-нибудь рассказал мне их 5 лет назад. Нажмите здесь , чтобы перейти к руководству для начинающих по GCP BigQuery, часть 1 Нажмите здесь , чтобы перейти к руководству для начинающих по GCP BigQuery, часть 2 BigQuery имеет множество преимуществ, включая, помимо прочего, экономичность, беспрецедентную скорость по сравнению с традиционными базами данных, бессерверную функциональность и бесшовную интеграцию с другими..

Как спрогнозировать продолжительность поездки с помощью BigQuery ML
Облачная платформа Google Как спрогнозировать продолжительность поездки с помощью BigQuery ML Используйте GCP для реализации проектов регрессии машинного обучения В этом руководстве будет рассмотрена лабораторная работа в Google Cloud Qwiklab: Создание моделей машинного обучения с помощью BigQuery ML: лаборатория испытаний . Мы будем использовать реальный набор данных, опубликованный в Google Cloud Public Dataset: austin_bikeshare , чтобы помочь выбрать новые модели велосипедов..

О чем вы говорите?
Я запустил Googles Bigquery в Архиве Github и просмотрел 332 миллиона push-событий github (прошло 51,5 секунды, обработано 31,5 ГБ) в публичные репозитории с февраля 2011 года. Каждый вклад изначально выглядит как новый, поскольку в Архиве нет данных о том, кто внес свой вклад до 12 февраля 2011 года, но эффект быстро исчезает, и мы видим довольно здоровую кривую роста. Самая ошеломляющая статистика - это среднее количество около шести тысяч НОВЫХ людей, загружающих код в github..

Бинарная логистическая регрессия с BigQuery ML
BigQuery - это полностью управляемое хранилище данных, предоставляемое Google Cloud Platform. Это один из самых популярных инструментов в арсенале Google, и то, как он масштабируется до петабайтной шкалы за несколько секунд, просто волшебство. Пользователи пишут свои запросы на знакомом языке SQL, и запросы обрабатываются для них прозрачно. BigQuery состоит из двух компонентов: 1.) Хранилище ( Colossus ) 2.) Механизм запросов ( Dremel ). Оба этих компонента соединены друг с другом с..