Вопросы по теме 'xml2'
XML во фрейм данных с отсутствующими узлами
Версии этого вопроса задавались раньше, как здесь и здесь . Однако я все еще не могу заставить его работать. Я пытаюсь преобразовать XML-документ во фрейм данных. Проблема в том, что некоторые из переменных не присутствуют для некоторых...
697 просмотров
schedule
16.05.2023
XML-документ как дерево от корня до листьев в r
Я пытаюсь представить древовидную структуру XML-документа в виде списка путей или списка объединенных имен узлов. Например:
<node id="A">
<node id = "AA">
<node id = "AAA"></node>
</node>
<node id...
195 просмотров
schedule
26.12.2022
Как извлечь текст только из родительского узла HTML (исключая дочерний узел)?
У меня есть код:
<div class="activityBody postBody thing">
<p>
<a href="/forum/conversation/post/3904-22" rel="post" data-id="3904-22" class="mqPostRef">(22)</a>
where?
</p>
</div>
Я...
1588 просмотров
schedule
15.03.2022
xml2 извлечь URL-адрес из файла .atomsvc
Я работаю над очисткой общедоступного источника данных, который использует файлы .atomsvc, чтобы пользователи могли настраивать поток данных в Excel. Я создал действительно хрупкий парсер в R, используя библиотеку XML для извлечения URL. Мне было...
572 просмотров
schedule
20.02.2023
используя регулярное выражение с xml2?
Рассмотрим этот простой пример
example_xml <- '<?xml version="1.0" encoding="UTF-8"?>
<file>
<book>
<text>abracadabra</text>
<node></node>
</book>
<book>
<text>hello...
398 просмотров
schedule
25.02.2023
Как настроить пакет curl в R с настройками веб-прокси по умолчанию?
Я использую R в коммерческой среде, где все внешние подключения проходят через веб-прокси, поэтому нам нужно указать адрес прокси-сервера и убедиться, что мы подключаемся к нему с аутентификацией Windows.
У меня уже есть код, который настроит...
2178 просмотров
schedule
26.08.2023
Ошибка libxml-2.0 не найдена при установке ggiraph
При попытке установить пакет R ggiraph на моем Mac OS X я столкнулся с проблемой зависимости xml2 .
Кажется, это довольно распространенная проблема для пользователей этого и других пакетов, поэтому, прочитав темы здесь и в других местах, я...
923 просмотров
schedule
08.04.2024
Разбор большого XML в фрейм данных в R
У меня есть большие файлы XML, которые я хочу превратить в фреймы данных для дальнейшей обработки в R и других программах. Все это делается в macOS.
Каждый ежемесячный XML имеет размер около 1 ГБ, содержит 150 тыс. записей и 191 различную...
3433 просмотров
schedule
05.03.2024
Извлечение данных из файлов XML с запутанными путями / именами узлов
Я пытаюсь извлечь значения из институциональных файлов XML с помощью R. Вот пример такого файла:
<?xml version="1.0" encoding="UTF-8" standalone="yes"?>
<missions xmlns="http://sensored">
<mission missiontype="2" year="2012"...
101 просмотров
schedule
15.04.2022
Как сохранить и прочитать вывод read_html в виде файла RDS?
Объекты можно сохранять и читать так
# Save as file
saveRDS(iris, "mydata.RDS")
# Read back in
readRDS("mydata.RDS")
Но, похоже, это не работает для объектов, созданных с помощью xml2::read_html()
Пример
library(rvest)
someobject...
587 просмотров
schedule
19.03.2023
Использование rvest для создания базы данных из нескольких файлов XML
Использование R для извлечения соответствующих данных из нескольких онлайн-файлов XML для создания базы данных
Я только начал изучать R для анализа текста. Вот что я пытаюсь сделать: я пытаюсь использовать rvest in r для создания базы данных CSV с...
73 просмотров
schedule
12.04.2022
Эффективно преобразовывать XML в фрейм данных
Мне нужно преобразовать некоторый ванильный xml в фрейм данных. XML представляет собой простое представление прямоугольных данных (см. пример ниже). Я могу довольно просто добиться этого в R с помощью xml2 и пары циклов for. Однако я уверен, что...
176 просмотров
schedule
23.04.2023
Как добавить новую строку в таблицу HTML
Я собираю данные для исторических результатов собачьих бегов для проекта Uni. Как я могу добавить столбец в таблицу с элементами из другой таблицы? В частности, таблица перед ней состоит из столбцов 3 и 4, поэтому добавьте эту информацию, чтобы...
37 просмотров
schedule
13.12.2023
rvest не получает информацию о продукте с помощью html_nodes()
Я использовал rvest для скрейпинга сведений о продукте (название, цена и доступность) в поисковой системе Amazon результаты . Мне удалось получить веб-страницу с помощью read_html() , но я не могу получить сведения о продукте (названия, цена и...
57 просмотров
schedule
27.07.2022