Игнорирование строк при загрузке дампа rdf с помощью TDBLoader в JENA

Когда мы загружаем большой дамп rdf freebase с помощью tdbloader, в нескольких строках могут быть ошибки, которые могут быть связаны с неправильной кодировкой, несоответствием «>» или даже некоторыми другими ошибками. TDBLoader в этом случае выдает ошибку, говорящую о том, что в определенном номере строки есть какая-то ошибка, и внезапно останавливается.

Есть ли какой-либо механизм, с помощью которого мы могли бы записать эту строку, и в следующем испытании с использованием командной строки мы могли бы указать этот номер строки для игнорирования для TDBLoader?


person London guy    schedule 05.01.2013    source источник
comment
Абхишек — вы задали тот же вопрос на [email protected], и сообщение, на которое ссылается Паоло, является ответом на ваше электронное письмо (29 декабря). Также есть дискуссия на freebase-discuss, в которую входят люди, создающие дамп.   -  person AndyS    schedule 06.01.2013
comment
Спасибо, Энди. Я думаю, что я должен использовать один канал для этих вопросов. Тогда я буду придерживаться списка пользователей @jena. Спасибо! :)   -  person London guy    schedule 07.01.2013


Ответы (1)


Пожалуйста, взгляните на это сообщение из списка рассылки jena-users (престижность Энди): http://mail-archives.apache.org/mod_mbox/jena-users/201212.mbox/%3C50DF4B56.9090208%40apache.org%3E

person castagna    schedule 06.01.2013