Скопировать выбранные статьи из Википедии в свою вики?

есть ли способ пакетного копирования определенных статей из википедии (около 10 000) на мой собственный сайт медиавики?

РЕДАКТИРОВАТЬ: Как мне это сделать, не перезаписывая статьи/страницы с одинаковыми именами? Также я не планирую использовать нелегальные средства (краулеры и т.д.)


person alimango    schedule 26.05.2009    source источник


Ответы (3)


Если вы хотите получить определенный набор статей, вы можете использовать страницу экспорта (http://en.wikipedia.org/wiki/Special:Export), чтобы получить XML-дамп задействованных страниц; вы можете экспортировать сразу несколько страниц, хотя вы можете захотеть разнести свои запросы.

Вы можете импортировать дампы XML в MediaWiki, используя Special:Import или один из скриптов импорта в maintenance/.

person Rob    schedule 26.05.2009
comment
Включает ли это изображения? Если нет, есть ли автоматический метод получения изображений? - person Paradius; 19.06.2009
comment
Он не включает изображения, потому что это прямой XML-дамп информации о странице, метаданных и тексте редакции, а формат не был расширен для включения двоичных данных изображения. Строго говоря, это техническое ограничение. Теоретически вы можете импортировать текст, нарушающий авторские права, и программа этого не остановит. - person Rob; 27.08.2009

База данных Википедии доступна для скачивания.

person victor hugo    schedule 26.05.2009

http://www.wikihow.com/Import-XML-Dumps-to-Your-MediaWiki-Wiki

Это поможет вам, я желаю.

person Mohsen Haqiqat    schedule 20.08.2012
comment
В SO при предоставлении ссылки на внешний сайт часто лучше дать хотя бы краткое описание содержимого на случай, если внешняя ссылка изменится или будет удалена. У будущих посетителей SO все еще будет что-то для работы. - person Fluffeh; 28.09.2012