Публикации по теме 'big-data'


Определение больших данных: как большие данные помогают бизнесу
Информационные технологии Информационные технологии принесли много изменений в нашу жизнь. Мы все больше зависим от устройств и данных. Умные часы сообщают нам, когда уровень кислорода падает. Ваши мобильные телефоны предупреждают вас о жаркой погоде и приближающихся циклонах. Теперь от вас не требуется сидеть перед телевизором и проводить часы за часами…

Как COVID-19 влияет на Medicaid
Коронавирус увеличит число получателей Medicaid Аббас Мурадж, управляющий директор по здравоохранению и биологическим наукам, Cloudera Эта статья является частью продолжающейся серии статей о проблемах, с которыми сталкивается здравоохранение в результате пандемии COVID-19. Я писал о том, как реагируют организации здравоохранения , ресурсы для цепочки поставок медицинских услуг , что происходит в рамках телемедицины, поведенческого здоровья, удаленного мониторинга, домашнего..

Большие данные, большие вопросы: что произойдет, если вы откажетесь от предположений?
Мустафа Коджак из NYU Tandon объясняет, почему алгоритмы иногда не должны делать прогнозы В прошлую среду Мустафа Анил Коджак из инженерной школы Тандон Нью-Йоркского университета пришел в CDS, чтобы объяснить, как можно уменьшить алгоритмические ошибки, указав алгоритму не делать прогнозов при определенных обстоятельствах. Алгоритмы машинного обучения часто используются для прогнозов в области финансов, медицины или недвижимости, но они все равно могут ошибаться. Это может иметь..

Управление памятью Spark [до версии 1.6.0]
Модель управления памятью Spark, описанная в этой статье, устарела в Apache Spark v1.6.0+, ссылку на новую модель памяти можно найти в этой статье . Вот схема распределения памяти Spark внутри кучи JVM в соответствии с моделью управления памятью до Apache Spark v1.6.0: Давайте разберемся, что это за разные компоненты один за другим: Безопасная куча . Любой процесс Spark, работающий в кластере или на локальном компьютере, является процессом JVM. Как и для любого процесса JVM,..

RAPIDS 0.7: Итак, мы идем дальше ...
Вышло RAPIDS 0.7! Как и Джефферсоны, RAPIDS во многих отношениях улучшается. RAPIDS доступен в большем количестве мест, чем когда-либо прежде, а XGBoost теперь проще использовать на нескольких графических процессорах. Так много всего, о чем стоит поговорить, так что давайте начнем. Большой успех XGBoost XGBoost проще использовать на нескольких графических процессорах, чем когда-либо прежде, благодаря улучшениям в RAPIDS dask-cudf и dask-xgboost . Мы ценим активное участие..

Как экспортировать файлы .csv из R более чем в 100 раз быстрее для работы с большими данными
TLDR; Вы должны использовать data.table::fwrite() для экспорта .csv из r, потому что это более чем в 100 раз быстрее, чем другие методы. Если вы хотите экспортировать свои данные в формате Excel xlsx, вам следует использовать openxlsx. Но это не рекомендуется для больших данных. Если вы хотите узнать больше о науке о данных в R, рекомендую эту книгу *. Почему вы должны экспортировать в .csv?

Поздоровайтесь (буквально) с Nematus, новым набором инструментов для нейронного машинного перевода.
Профессор Кёнхён Чо и компания произвели революцию в традиционном машинном переводе в своем последнем проекте Буквально на прошлой неделе профессор Центра наук о данных Кёнхён Чо вместе с международной группой коллег* выпустил Nematus , захватывающий набор инструментов для нейронного машинного перевода (NMT). Nematus, финансируемый исследовательской и инновационной программой Horizon 2020 Европейского Союза, выполняет нейронный машинный перевод с использованием модели кодер-декодер ,..