Очистка ввода RSS в Rails

Я загружаю RSS-канал из Craigslist в приложение rails, которое я создаю. Когда я пытаюсь вставить контент из сообщений в свою базу данных, появляется множество плохих символов, из-за которых база данных захлебывается.

Я пробовал несколько разных методов (плагин Sanitize, hpricot, регулярное выражение ввода), но ничего не работает.

Я все еще новичок в рельсах, поэтому решил обратиться к сообществу. Есть какие-нибудь советы о том, как работать с бездельниками в RSS-потоках?


person thekevinscott    schedule 18.08.2010    source источник


Ответы (2)


Вы пробовали Nokogiri (Railscasts видео)?

На самом деле у Райана Бейтса есть экранный снимок по синтаксическому анализу канала: синтаксический анализ канала.

person Jon Smock    schedule 18.08.2010

Мне нравится Feed Normalizer http://feed-normalizer.rubyforge.org/

person Martin Labuschin    schedule 19.08.2010