Вопросы по теме 'rvest'

Как я могу использовать цикл для очистки данных веб-сайта для нескольких веб-страниц в R?
Я хотел бы применить цикл для очистки данных с нескольких веб-страниц в R. Я могу очистить данные для одной веб-страницы, однако, когда я пытаюсь использовать цикл для нескольких страниц, я получаю неприятную ошибку. Я потратил часы на возню, но...
4991 просмотров
schedule 13.08.2022

Скрапинг веб-сайта для правительственной информации с помощью R
Я просматриваю канадский федеральный веб-сайт для исследовательского проекта по онлайн-петициям. Это весь сайт: http://www.oag-bvg.gc.ca/internet/English/pet_lp_e_940.html Мне нужно получить эту информацию для каждой петиции: гиперссылка...
126 просмотров
schedule 12.08.2023

Веб-парсинг изображения
Я начинающий. Я создал небольшой код для парсинга веб-страниц с помощью rvest. Я нашел очень удобный код %>% html_node ()%>% html_text ()%>% as.numeric () , но мне не удалось правильно изменить код для парсинга url изображения. Мой...
5734 просмотров
schedule 10.08.2022

Сбор данных о местоположении в rvest
В настоящее время я пытаюсь очистить данные широты / долготы из списка URL-адресов, которые у меня есть, используя rvest. Каждый URL-адрес имеет встроенную карту Google с определенным местоположением, но сами URL-адреса не показывают путь, по...
1700 просмотров
schedule 11.09.2022

Объединить фреймы данных после использования rvest
Моя задача — собрать данные о бейсболе всех 30 команд и объединить их в одну таблицу. Тем не менее, я продолжаю получать целое число (0) в качестве возврата. Вот мои кадры данных: install.packages("rvest") library(rvest) # Store web url...
157 просмотров
schedule 07.12.2022

Очистка с помощью rvest - в комплекте с NA при отсутствии тега
Я хочу проанализировать этот HTML: и получить из него следующие элементы: а) тег p с class: "normal_encontrado" . б) div с class: "price" . Иногда тег p отсутствует в некоторых продуктах. В этом случае к вектору, собирающему текст из...
3880 просмотров
schedule 21.05.2024

Форма отправки без кнопки отправки в rvest
Я пытаюсь написать сканер для загрузки некоторой информации, похожей на это сообщение о переполнении стека. Ответ полезен для создания заполненной формы, но я изо всех сил пытаюсь найти способ отправить форму, когда кнопка отправки не часть формы....
3177 просмотров
schedule 10.06.2023

Как пройти ssl_verifypeer в Rvest?
Я пытаюсь использовать Rvest для очистки таблицы с внутренней веб-страницы здесь, в $JOB. Я использовал методы, перечисленные здесь чтобы получить xpath и т.д. Мой код довольно прост: library(httr) library(rvest) un = "username"; pw =...
1993 просмотров
schedule 24.04.2024

Rvest: ‹80% в html-тексте вызывает ошибку синтаксического анализа
При попытке очистить некоторые веб-сайты для ставок по ипотечным кредитам выяснилось, что «‹80%» в теге option вызывает ошибки при обработке. library(rvest) url <-...
111 просмотров
schedule 17.12.2022

Неизвестное поле с рвестом
Я пытаюсь выполнить парсинг через rvest , но, похоже, поля не распознаются, и срабатывает функция set_values ​​ : session <- html_session("http://www.itto.int/annual_review_output/?mode=searchdata") form <- html_form(session)[[2]]...
625 просмотров
schedule 02.03.2022

R: очистить несколько URL-адресов с помощью команд pipechain в Rvest
У меня есть список chr с несколькими URL-адресами. Я хочу загрузить контент с каждого из этих URL-адресов. Чтобы избежать написания сотен команд, я хочу автоматизировать процесс с помощью цикла с использованием lapply. Однако моя команда...
756 просмотров
schedule 22.11.2022

Ошибка блестящего приложения при развертывании, работает локально (rvest - ›проблема с html_nodes)
У меня есть приложение Shiny, которое загружает zip-файл с сайта полицейского управления Атланты и распаковывает его во временный файл. Приложение работает нормально локально, но когда я развертываю его на shinyapps.io, я получаю сообщение об ошибке:...
559 просмотров
schedule 04.05.2023

Ошибка в open.connection(x, rb): ошибка HTTP 405
При попытке извлечь данные из Glassdoor я получил следующую ошибку. Ошибка в open.connection(x, "rb"): ошибка HTTP 405. Вот код: rm(list=ls()) library("rvest") htmlpage <-...
608 просмотров
schedule 10.11.2022

Как закрыть неиспользуемые соединения после read_html в R
Я новичок в R и пытаюсь получить доступ к некоторой информации в Интернете, но у меня проблемы с подключениями, которые, похоже, не закрываются. Я был бы очень признателен, если бы кто-нибудь здесь дал мне совет ... Первоначально я хотел...
5931 просмотров
schedule 09.03.2022

Очистка строкового кода от URL и помещение в вектор с помощью rvest в R
Я новичок в r и rvest. Два дня назад мне помогли с этим кодом, который очищает все имена игроков и работает хорошо. Теперь я пытаюсь добавить код в функцию «fetch_current_players», где она также создает вектор кодов игроков для этого веб-сайта...
203 просмотров
schedule 28.05.2022

Как извлечь текст только из родительского узла HTML (исключая дочерний узел)?
У меня есть код: <div class="activityBody postBody thing"> <p> <a href="/forum/conversation/post/3904-22" rel="post" data-id="3904-22" class="mqPostRef">(22)</a> where? </p> </div> Я...
1588 просмотров
schedule 15.03.2022

Веб-анализ ключевой статистики в Yahoo! Финансы с R
Есть ли у кого-нибудь опыт извлечения данных из Yahoo! Страница ключевой статистики финансов с R? Мне знакомо извлечение данных непосредственно из HTML с использованием read_html , html_nodes() и html_text() из пакета rvest . Однако эта...
4946 просмотров
schedule 21.04.2022

html_form из rvest не распознает форму
Я пытаюсь очистить содержимое этого веб-сайта с помощью rvest ( не связанных статей / рефератов, а только количество, название, авторов и т. д.). По умолчанию на странице отображаются только документы 2016 года, и очистить данные за 2016 год...
969 просмотров
schedule 21.11.2022

Удаление тега Span в R; данные появляются дважды
Я пытаюсь извлечь данные из html-страницы в R с помощью кода ниже: wiki_url_html <- read_html("https://en.wikipedia.org/wiki/List_of_Major_League_Baseball_players_suspended_for_performance-enhancing_drugs") bb_player_PED <- (wiki_url_html...
142 просмотров
schedule 27.07.2023

Webscrape с Rselenium и Rvest из раскрывающегося списка, где изменяется идентификатор
Я хочу поскрести дату НБА с веб-сайта numberfire по адресу: https://www.numberfire.com/nba/daily-fantasy/daily-basketball-projection Я пытаюсь перейти в раскрывающийся список и переключить отображаемые данные с Fanduel на Draftkings. Первая...
370 просмотров
schedule 17.09.2023