Вопросы по теме 'bs4'
Как извлечь ссылку из ‹a› внутри ‹h2 class = section-heading›: BeautifulSoup
Я пытаюсь извлечь ссылку, которая написана так:
<h2 class="section-heading">
<a href="http://www.nytimes.com/pages/arts/index.html">Arts »</a>
</h2>
мой код:
from bs4 import BeautifulSoup
import requests, re...
3597 просмотров
schedule
04.11.2023
Выход BeautifulSoup остается []
Я пытаюсь очистить тексты с веб-сайта с запросами BeautifulSoup + python. Но это только получение [] в качестве вывода.
from bs4 import BeautifulSoup
import requests
url =...
606 просмотров
schedule
29.10.2022
ImportError для внешнего модуля только при запуске py.test
Самое близкое, что я нашел для своей проблемы, это этот вопрос: the-app">ImportError появляется с py.test, но не при запуске приложения , за исключением моего случая, когда я получаю ImportError из внешней библиотеки, которую я установил с помощью...
317 просмотров
schedule
17.01.2024
Beautifulsoup4 выбирает системный python2.6 по умолчанию, а не мой локальный python3
Я работаю в системе, где у меня нет прав администратора. У меня есть локальная среда, в которой я установил python3, pip3 и bs4. Кажется, что в системе python2.6 по умолчанию также установлен пакет BeautifulSoup. В результате мой код Python...
82 просмотров
schedule
09.06.2023
Получить имя автора и URL-адрес для тега от ученого Google
Я хочу записать в файл CSV список всех авторов с их URL-адресом в файле CSV, которые классифицируют себя как определенный тег в Google Scholar. Например, если бы мы взяли 'security' , я хотел бы этот вывод:
author url
Howon Kim...
684 просмотров
schedule
06.12.2023
Кодировка utf-8 и греческие символы
Хотя мне удалось получить все данные, которые мне нужны, а также сохранить их в файле cv, результат, который я получаю, находится в формате UTF-8, что нормально (поправьте меня, если я ошибаюсь)
TBH Я уже "играл" с опциями .encode () и .decode ()...
9782 просмотров
schedule
28.07.2022
установить bs4 на сервер pythonanywhere
Я попытался установить запросы и красивый суп-модуль (bs4) на сервер pythonanywhere с помощью этой команды:
pip3 install requests
но он получил и ошибка сказала: требование уже выполнено... и получил адрес в каталоге dist-package. Я нашел...
721 просмотров
schedule
12.02.2024
Beautiful Soup BS4 data-foo связанный текст между тегами не отображается
Из этого тега:
<div class="matchDate renderMatchDateContainer" data-kickoff="1313244000000">Sat 13 Aug 2011</div>
Я хочу извлечь «Сб, 13 августа 2011 г.», используя bs4 Beautiful Soup.
Мой текущий код:
import requests
from...
468 просмотров
schedule
21.04.2023