Вопросы по теме 'bs4'

Как извлечь ссылку из ‹a› внутри ‹h2 class = section-heading›: BeautifulSoup
Я пытаюсь извлечь ссылку, которая написана так: <h2 class="section-heading"> <a href="http://www.nytimes.com/pages/arts/index.html">Arts »</a> </h2> мой код: from bs4 import BeautifulSoup import requests, re...
3597 просмотров
schedule 04.11.2023

Выход BeautifulSoup остается []
Я пытаюсь очистить тексты с веб-сайта с запросами BeautifulSoup + python. Но это только получение [] в качестве вывода. from bs4 import BeautifulSoup import requests url =...
606 просмотров

ImportError для внешнего модуля только при запуске py.test
Самое близкое, что я нашел для своей проблемы, это этот вопрос: the-app">ImportError появляется с py.test, но не при запуске приложения , за исключением моего случая, когда я получаю ImportError из внешней библиотеки, которую я установил с помощью...
317 просмотров
schedule 17.01.2024

Beautifulsoup4 выбирает системный python2.6 по умолчанию, а не мой локальный python3
Я работаю в системе, где у меня нет прав администратора. У меня есть локальная среда, в которой я установил python3, pip3 и bs4. Кажется, что в системе python2.6 по умолчанию также установлен пакет BeautifulSoup. В результате мой код Python...
82 просмотров
schedule 09.06.2023

Получить имя автора и URL-адрес для тега от ученого Google
Я хочу записать в файл CSV список всех авторов с их URL-адресом в файле CSV, которые классифицируют себя как определенный тег в Google Scholar. Например, если бы мы взяли 'security' , я хотел бы этот вывод: author url Howon Kim...
684 просмотров
schedule 06.12.2023

Кодировка utf-8 и греческие символы
Хотя мне удалось получить все данные, которые мне нужны, а также сохранить их в файле cv, результат, который я получаю, находится в формате UTF-8, что нормально (поправьте меня, если я ошибаюсь) TBH Я уже "играл" с опциями .encode () и .decode ()...
9782 просмотров
schedule 28.07.2022

установить bs4 на сервер pythonanywhere
Я попытался установить запросы и красивый суп-модуль (bs4) на сервер pythonanywhere с помощью этой команды: pip3 install requests но он получил и ошибка сказала: требование уже выполнено... и получил адрес в каталоге dist-package. Я нашел...
721 просмотров

Beautiful Soup BS4 data-foo связанный текст между тегами не отображается
Из этого тега: <div class="matchDate renderMatchDateContainer" data-kickoff="1313244000000">Sat 13 Aug 2011</div> Я хочу извлечь «Сб, 13 августа 2011 г.», используя bs4 Beautiful Soup. Мой текущий код: import requests from...
468 просмотров
schedule 21.04.2023