Вопросы по теме 'xml2'

XML во фрейм данных с отсутствующими узлами
Версии этого вопроса задавались раньше, как здесь и здесь . Однако я все еще не могу заставить его работать. Я пытаюсь преобразовать XML-документ во фрейм данных. Проблема в том, что некоторые из переменных не присутствуют для некоторых...
697 просмотров
schedule 16.05.2023

XML-документ как дерево от корня до листьев в r
Я пытаюсь представить древовидную структуру XML-документа в виде списка путей или списка объединенных имен узлов. Например: <node id="A"> <node id = "AA"> <node id = "AAA"></node> </node> <node id...
195 просмотров
schedule 26.12.2022

Как извлечь текст только из родительского узла HTML (исключая дочерний узел)?
У меня есть код: <div class="activityBody postBody thing"> <p> <a href="/forum/conversation/post/3904-22" rel="post" data-id="3904-22" class="mqPostRef">(22)</a> where? </p> </div> Я...
1588 просмотров
schedule 15.03.2022

xml2 извлечь URL-адрес из файла .atomsvc
Я работаю над очисткой общедоступного источника данных, который использует файлы .atomsvc, чтобы пользователи могли настраивать поток данных в Excel. Я создал действительно хрупкий парсер в R, используя библиотеку XML для извлечения URL. Мне было...
572 просмотров
schedule 20.02.2023

используя регулярное выражение с xml2?
Рассмотрим этот простой пример example_xml <- '<?xml version="1.0" encoding="UTF-8"?> <file> <book> <text>abracadabra</text> <node></node> </book> <book> <text>hello...
398 просмотров
schedule 25.02.2023

Как настроить пакет curl в R с настройками веб-прокси по умолчанию?
Я использую R в коммерческой среде, где все внешние подключения проходят через веб-прокси, поэтому нам нужно указать адрес прокси-сервера и убедиться, что мы подключаемся к нему с аутентификацией Windows. У меня уже есть код, который настроит...
2178 просмотров
schedule 26.08.2023

Ошибка libxml-2.0 не найдена при установке ggiraph
При попытке установить пакет R ggiraph на моем Mac OS X я столкнулся с проблемой зависимости xml2 . Кажется, это довольно распространенная проблема для пользователей этого и других пакетов, поэтому, прочитав темы здесь и в других местах, я...
923 просмотров
schedule 08.04.2024

Разбор большого XML в фрейм данных в R
У меня есть большие файлы XML, которые я хочу превратить в фреймы данных для дальнейшей обработки в R и других программах. Все это делается в macOS. Каждый ежемесячный XML имеет размер около 1 ГБ, содержит 150 тыс. записей и 191 различную...
3433 просмотров
schedule 05.03.2024

Извлечение данных из файлов XML с запутанными путями / именами узлов
Я пытаюсь извлечь значения из институциональных файлов XML с помощью R. Вот пример такого файла: <?xml version="1.0" encoding="UTF-8" standalone="yes"?> <missions xmlns="http://sensored"> <mission missiontype="2" year="2012"...
101 просмотров
schedule 15.04.2022

Как сохранить и прочитать вывод read_html в виде файла RDS?
Объекты можно сохранять и читать так # Save as file saveRDS(iris, "mydata.RDS") # Read back in readRDS("mydata.RDS") Но, похоже, это не работает для объектов, созданных с помощью xml2::read_html() Пример library(rvest) someobject...
587 просмотров
schedule 19.03.2023

Использование rvest для создания базы данных из нескольких файлов XML
Использование R для извлечения соответствующих данных из нескольких онлайн-файлов XML для создания базы данных Я только начал изучать R для анализа текста. Вот что я пытаюсь сделать: я пытаюсь использовать rvest in r для создания базы данных CSV с...
73 просмотров
schedule 12.04.2022

Эффективно преобразовывать XML в фрейм данных
Мне нужно преобразовать некоторый ванильный xml в фрейм данных. XML представляет собой простое представление прямоугольных данных (см. пример ниже). Я могу довольно просто добиться этого в R с помощью xml2 и пары циклов for. Однако я уверен, что...
176 просмотров
schedule 23.04.2023

Как добавить новую строку в таблицу HTML
Я собираю данные для исторических результатов собачьих бегов для проекта Uni. Как я могу добавить столбец в таблицу с элементами из другой таблицы? В частности, таблица перед ней состоит из столбцов 3 и 4, поэтому добавьте эту информацию, чтобы...
37 просмотров
schedule 13.12.2023

rvest не получает информацию о продукте с помощью html_nodes()
Я использовал rvest для скрейпинга сведений о продукте (название, цена и доступность) в поисковой системе Amazon результаты . Мне удалось получить веб-страницу с помощью read_html() , но я не могу получить сведения о продукте (названия, цена и...
57 просмотров
schedule 27.07.2022