Найти и заменить справку, чтобы удалить определенные элементы из текста

У меня есть файл, содержащий 18 тыс. строк текста, который состоит из ссылок и идентификационных кодов rondom и выглядит так:

"

http://arduino.cc/en/Main/ArduinoBoardNano
SC09661
http://arduino.cc/en/Main/ArduinoBoardUno
http://www.farnell.com/datasheets/1639172.pdf

SC09670
http://arduino.cc/en/Main/ArduinoBoardUno
SC09665
http://arduino.cc/en/Main/ArduinoEthernetShield
SC09662
http://arduino.cc/en/Main/ArduinoXbeeShield
CS23020
http://bcove.me/zypzpy2q
SC09147
http://cache.national.com/ds/LM/LM134.pdf
SC08546
http://cache.national.com/ds/LM/LM2574.pdf
SC08540
http://cache.national.com/ds/LM/LM2576.pdf

"Мне нужно удалить из этого текста все эти идентификационные коды (SC08540,SC09662,...) и ссылки, которые не заканчиваются на .pdf, я знаю, что это возможно с помощью Notepad++ и других программ с функцией замены, но я не знаю, как именно я должен сделать это.Может быть, я мог бы получить помощь с этим?


person Tautvydas    schedule 09.12.2012    source источник


Ответы (1)


Я не нашел способа сделать это за один раз с помощью Notepad++, но это должно сработать:

  • Откройте поле замены (Search --> Replace...) и выберите Regular expression.
  • Найдите ^.*[^\.][^p][^d][^f]$
  • Убедитесь, что Replace with пусто
  • Replace All

Теперь у вас есть файл с пустыми строками и нужными вам ссылками. Есть как минимум два способа избавиться от пустых строк:

Способ 1: плагин TextFX

  • Выбрать весь текст
  • TextFX --> TextFX Edit --> Delete blank lines

Способ 2: Заменить

  • Убедитесь, что курсор находится в начале документа
  • Откройте поле замены (Search --> Replace...) и выберите Extended
  • Найдите \n\r
  • Убедитесь, что Replace with пусто
  • Replace All
person ellak    schedule 11.12.2012