использование Watson Discovery для доступа к общедоступным URL

мы используем сервис Watson Discovery, чтобы найти ответы на вопросы, связанные с путешествиями. К сожалению, используемые здесь документы не статичны, а представляют собой форум, посвященный путешествиям в Интернете. Итак, нам нужно Discovery для доступа к этим URL-адресам для аннотирования различных компонентов (сущностей, отношений, настроений и т. Д.), А позже мы можем запрашивать на их основе, чтобы найти правильную ссылку, которая имеет ответы. Однако я вижу, что обнаружение поддерживает только файлы в виде набора документов, а не URL. Я помню, как API алхимии и новый сервис NLU поддерживают URL. Есть ли способ получить доступ к URL-адресу для обнаружения? Мы выбрали службу обнаружения для нашего решения из-за ее поддержки запросов, которой, похоже, нет в NLU или Alchemy.


person Manoj K Sardana    schedule 22.03.2017    source источник
comment
Боюсь, вы не сможете, потому что Watson Discovery - это выполнение запросов в репозитории проиндексированных документов. Однако вы можете настроить поисковый робот для извлечения информации с форума в Интернете, чтобы вы могли выполнять по нему запросы - см. console.bluemix.net/docs/services/discovery/   -  person Leo    schedule 27.11.2017


Ответы (1)


Чтобы получить доступ к общедоступному URL-адресу, вам необходимо создать своего рода веб-сканер, который преобразует веб-сайт в правильный формат, доступный для поискового робота.

Подробнее здесь: https://www.ibm.com/watson/developercloud/doc/discovery/data-crawler-seeds.html.

person Simon O'Doherty    schedule 23.03.2017
comment
Спасибо. Кажется, это единственный выход. К сожалению, поисковый робот, упомянутый в Watson Discovery, не поддерживает оконную платформу. Возможно, я смогу отразить сайт с помощью wget для Windows, но это не будет иметь никакого значения, поскольку сканер не поддерживает загрузку в Watson Discovery. Я надеюсь, что скоро у нас появится поддержка window. - person Manoj K Sardana; 26.03.2017