Как передать архив Slack в GSA?

Мне интересно, как я могу использовать Slack API для передачи истории сообщений в GSA (Google Search Appliance) и поддерживать ее в актуальном состоянии.

Кто-нибудь писал для этого скрипт?


person sorin    schedule 01.05.2015    source источник
comment
Знаете ли вы новый механизм соединения GSA? Он использует обходчик для обхода страницы динамического индекса, созданной соединителем. В зависимости от того, что предлагает slack API, у вас может быть простой вызов REST для создания такой индексной страницы, которую GSA затем сможет сканировать.   -  person Marged    schedule 22.05.2015


Ответы (1)


У меня нет готового сценария, но это должно быть возможно, как вы и предполагали; IMO (не будучи знакомым с slack api, но с некоторым знанием размеров slack-архива, т. е. > 500 000 сообщений), я думаю, что основная задача будет состоять в том, чтобы идентифицировать и извлекать только важные для вас фрагменты информации из slack-архив (из-за которого вы можете легко исчерпать лимит лицензии на индекс документов GSA, если вы слишком дискретно выберете элементы записи канала GSA — например, представьте, если бы каждое сообщение было отдельной записью канала).

Другими словами, вам необходимо идентифицировать отдельные записи веб-каналов, сохраняя их как можно более атомарными, чтобы свести к минимуму использование лицензии на документ, сохраняя при этом их достаточно дискретными для получения точных результатов.

Как только это будет сделано или если ограничение вашей лицензии индекса GSA не является проблемой, одним из возможных решений является создание добавочного/полного канала путем чтения обновлений из резервного архива с использованием его API, а затем компиляции новых найденных записей в канал GSA. формата (с информацией, которую вы хотите иметь возможность искать/исключать, содержащейся в тегах, если это необходимо, и информацией, которую вам нужно представить в результатах, содержащейся в метатегах html), и отправить эти новые записи в GSA. .

Другое решение, если вы сможете разместить несколько страниц веб-приложений, для которых вы можете использовать сканирование GSA, даже позволит вам поддерживать его индекс в актуальном состоянии с помощью непрерывного сканирования. Для этого вам понадобится как минимум одна «страница перехода», которая будет просто списком ссылок, каждая из которых заполнена параметрами строки запроса, которые будут переданы на вашу страницу подробной записи, которая будет служить для идентификации набора различных элементов архива слабых сообщений. Идентификаторы, которые вы определили как требующие индексации в виде отдельной записи. Затем вам нужно будет настроить URL-адрес «страницы перехода» для сканирования GSA, а также разработать XSLT или другую службу потребителей результатов поиска, чтобы иметь возможность читать/отображать возвращаемые результаты с информацией, содержащейся в метатегах. Примечание. Когда служба потребителей выполняет поисковый вызов GSA, ей необходимо передать параметр строки запроса «&getfields=*», чтобы заставить GSA вернуть всю информацию, содержащуюся в метатегах.

Я надеюсь, что моя формулировка не слишком эзотерична и каким-то образом поможет вам в разработке вашего решения.

person Siddharth Patil    schedule 09.06.2015