Как разбить строку в оболочке и получить последнее поле [bash, split, tokenize, cut]

arrow_upward
480
arrow_downward

Вы можете использовать строковые операторы:

$ foo=1:2:3:4:5
$ echo ${foo##*:}
5

Это с жадностью обрезает все от лицевой стороны до символа ":".

${foo  <-- from variable foo
  ##   <-- greedy front trim
  *    <-- matches anything
  :    <-- until the last ':'
 }

Stephen 02.07.2010

comment

Хотя это работает для данной проблемы, ответ Уильяма ниже (stackoverflow.com/a/3163857/520162) также возвращает 5, если строка равна 1:2:3:4:5: (при использовании строковых операторов возвращается пустой результат). Это особенно удобно при анализе путей, которые могут содержать (или не содержать) завершающий символ /. - eckes; 23.01.2013

comment

Как бы вы тогда поступили наоборот? для вывода "1: 2: 3: 4:"? - Dobz; 25.06.2014

comment

А как сохранить часть перед последним разделителем? Видимо, используя ${foo%:*}. # - с начала; % - с конца. #, % - кратчайшее совпадение; ##, %% - самое длинное совпадение. - Mihai Danila; 09.07.2014

comment

Если я хочу получить последний элемент из пути, как мне его использовать? echo ${pwd##*/} не работает. - Putnik; 12.02.2016

comment

@Putnik, эта команда видит pwd как переменную. Попробуйте dir=$(pwd); echo ${dir##*/}. Работает для меня! - Stan Strum; 17.12.2017

comment

@Stephen Как использовать точку (.) В качестве разделителя? - Manoj; 27.06.2018

comment

@Stan еще короче echo ${$(pwd)##*/} - Cadoiz; 16.06.2021

arrow_upward
372
arrow_downward

Другой способ - поменять местами до и после cut:

$ echo ab:cd:ef | rev | cut -d: -f1 | rev
ef

Это позволяет очень легко получить предпоследнее поле или любой диапазон полей, пронумерованных с конца.

a3nm 03.02.2012

comment

Этот ответ хорош, потому что в нем используется слово «вырезать», которое автору (предположительно) уже известно. Кроме того, мне нравится этот ответ, потому что Я использую слово «вырезать» и у меня возник именно такой вопрос, поэтому я нашел эту ветку через поиск. - Dannid; 15.01.2013

comment

Немного вырезки и вставки для людей, использующих пробелы в качестве разделителей: echo "1 2 3 4" | rev | cut -d " " -f1 | rev - funroll; 12.08.2013

comment

рев | вырезать -d -f1 | rev такой умный! Спасибо! Мне очень помогло (мой вариант использования был rev | -d '' -f 2- | rev - EdgeCaseBerg; 08.09.2013

comment

Я всегда забываю о rev, это было именно то, что мне было нужно! cut -b20- | rev | cut -b10- | rev - shearn89; 17.08.2017

comment

Я закончил с этим решением, моя попытка вырезать пути к файлам с помощью awk -F / '{print $ NF}' несколько сломалась для меня, так как имена файлов, включая пробелы, также были разделены - THX; 26.02.2018

comment

Осторожно: rev небезопасен с многобайтовыми символами Юникода! Поэтому некоторые угловые случаи могут не работать с rev. - t0r0X; 02.03.2018

comment

@ t0r0X: Ты уверен? На моей машине с LC_ALL=en_US.utf8 запуск echo 'hé' | rev правильно возвращает éh. Мне нужно запустить echo 'hé' | LC_ALL=C rev, чтобы получить сообщение об ошибке: rev: stdin: Invalid or incomplete multibyte or wide character. - a3nm; 02.03.2018

comment

за исключением того, что: -sh: rev: command not found на моем NAS кажется, что rev не так распространен, в противном случае я согласен, что он лучше отвечает на вопрос о сокращении - papo; 19.11.2018

comment

Фантастика! Я хотел получить только домены верхнего и второго уровня из доменного имени. С cut я могу превратить www.google.com в google.com! - b_laoshi; 29.11.2018

comment

arrow_upward
84
arrow_downward

Трудно получить последнее поле с помощью cut, но вот несколько решений на awk и perl

echo 1:2:3:4:5 | awk -F: '{print $NF}'
echo 1:2:3:4:5 | perl -F: -wane 'print $F[-1]'

William Pursell 02.07.2010

comment

большое преимущество этого решения перед принятым ответом: оно также сопоставляет пути, содержащие или не содержащие завершающий символ /: /a/b/c/d и /a/b/c/d/ дают одинаковый результат (d) при обработке pwd | awk -F/ '{print $NF}'. Принятый ответ дает пустой результат в случае /a/b/c/d/ - eckes; 23.01.2013

comment

@eckes В случае решения AWK, в GNU bash, версия 4.3.48 (1) -release, это неверно, так как это имеет значение, если у вас есть завершающая косая черта или нет. Проще говоря, AWK будет использовать / в качестве разделителя, а если ваш путь - /my/path/dir/, он будет использовать значение после последнего разделителя, которое является просто пустой строкой. Так что лучше избегать косой черты в конце, если вам нужно сделать что-то подобное, как это делаю я. - stamster; 21.05.2018

comment

Как мне получить подстроку ДО последнего поля? - blackjacx; 09.06.2020

comment

@blackjacx Есть некоторые причуды, но что-то вроде awk '{$NF=""; print $0}' FS=: OFS=: часто работает достаточно хорошо. - William Pursell; 09.06.2020

arrow_upward
34
arrow_downward

Предполагая довольно простое использование (например, без экранирования разделителя), вы можете использовать grep:

$ echo "1:2:3:4:5" | grep -oE "[^:]+$"
5

Разбивка - найдите все символы, кроме разделителя ([^:]) в конце строки ($). -o печатает только соответствующую часть.

Nicholas M T Elliott 01.07.2010

comment

-E означает использование расширенного синтаксиса; [^ ...] означает что угодно, кроме перечисленных символов; + один или несколько таких совпадений (будет иметь максимально возможную длину для шаблона; этот элемент является расширением GNU) - например, разделительные символы - это двоеточие. - Alexander Stohr; 17.10.2019

arrow_upward
18
arrow_downward

В одну сторону:

var1="1:2:3:4:5"
var2=${var1##*:}

Другой, используя массив:

var1="1:2:3:4:5"
saveIFS=$IFS
IFS=":"
var2=($var1)
IFS=$saveIFS
var2=${var2[@]: -1}

Еще один с массивом:

var1="1:2:3:4:5"
saveIFS=$IFS
IFS=":"
var2=($var1)
IFS=$saveIFS
count=${#var2[@]}
var2=${var2[$count-1]}

Использование регулярных выражений Bash (версия> = 3.2):

var1="1:2:3:4:5"
[[ $var1 =~ :([^:]*)$ ]]
var2=${BASH_REMATCH[1]}

Dennis Williamson 02.07.2010

arrow_upward
12
arrow_downward

$ echo "a b c d e" | tr ' ' '\n' | tail -1
e

Просто переведите разделитель в новую строку и выберите последнюю запись с tail -1.

user3133260 24.12.2013

comment

Он завершится ошибкой, если последний элемент содержит \n, но в большинстве случаев это наиболее удобочитаемое решение. - Yajo; 30.07.2014

arrow_upward
10
arrow_downward

Вы можете попробовать что-то вроде этого, если хотите использовать cut:

echo "1:2:3:4:5" | cut -d ":" -f5

Вы также можете использовать grep вот так:

echo " 1:2:3:4:5" | grep -o '[^:]*$'

Abdallah_98 06.02.2021

comment

Ваша вторая команда мне пригодилась. Не могли бы вы сломать это, чтобы я мог лучше понять? Спасибо. - John; 02.03.2021

comment

Второй работает как шарм! Спасибо - borja garcia; 15.04.2021

arrow_upward
7
arrow_downward

Использование sed:

$ echo '1:2:3:4:5' | sed 's/.*://' # => 5

$ echo '' | sed 's/.*://' # => (empty)

$ echo ':' | sed 's/.*://' # => (empty)
$ echo ':b' | sed 's/.*://' # => b
$ echo '::c' | sed 's/.*://' # => c

$ echo 'a' | sed 's/.*://' # => a
$ echo 'a:' | sed 's/.*://' # => (empty)
$ echo 'a:b' | sed 's/.*://' # => b
$ echo 'a::c' | sed 's/.*://' # => c

Rafael 10.11.2016

comment

учитывая, что вывод многих утилит имеет форму исходного имени файла, за которым следует двоеточие (:), за которым следует вывод утилиты ($ {path}: $ {output}), это невероятно полезно для добавления вашего собственного управляющего символа, такого как TAB $ '\ t' или разделитель единиц $ '\ 037' и т. д. после последнего двоеточия. пример добавления TAB в последнее двоеточие вывода файла: file ~ / yourPath / * | sed s / \ (. *: \) \ (. * \) / \ 1 $ '\ t' \ 2 / - spioter; 03.09.2020

arrow_upward
3
arrow_downward

Если ваше последнее поле состоит из одного символа, вы можете сделать это:

a="1:2:3:4:5"

echo ${a: -1}
echo ${a:(-1)}

Проверьте обработку строк в bash.

Ab Irato 13.11.2013

comment

Это не работает: это дает последний символ a, а не последнее поле. - gniourf_gniourf; 13.11.2013

comment

Правда, в том-то и дело, если вы знаете длину последнего поля, это хорошо. Если нет, вам нужно использовать что-то еще ... - Ab Irato; 25.11.2013

arrow_upward
3
arrow_downward

Здесь есть много хороших ответов, но я все же хочу поделиться этим, используя basename:

 basename $(echo "a:b:c:d:e" | tr ':' '/')

Однако он завершится ошибкой, если в вашей строке уже есть "/". Если косая черта / является вашим разделителем, вам просто нужно (и следует) использовать базовое имя.

Это не лучший ответ, но он просто показывает, как вы можете проявить творческий подход, используя команды bash.

021 26.04.2016

arrow_upward
1
arrow_downward

Используя Bash.

$ var1="1:2:3:4:0"
$ IFS=":"
$ set -- $var1
$ eval echo  \$${#}
0

ghostdog74 02.07.2010

comment

Можно было использовать echo ${!#} вместо eval echo \$${#}. - Rafa; 28.04.2017

arrow_upward
1
arrow_downward

echo "a:b:c:d:e"|xargs -d : -n1|tail -1

Сначала используйте xargs, разделите его с помощью ":", - n1 означает, что каждая строка имеет только одну часть. Затем, pring последнюю часть.

Crytis 07.12.2016

arrow_upward
0
arrow_downward

Сопоставление регулярных выражений в sed является жадным (всегда идет до последнего вхождения), что вы можете использовать здесь в своих интересах:

$ foo=1:2:3:4:5
$ echo ${foo} | sed "s/.*://"
5

slushy 29.01.2019

arrow_upward
0
arrow_downward

Решение с использованием встроенного чтения:

IFS=':' read -a fields <<< "1:2:3:4:5"
echo "${fields[4]}"

Или, чтобы сделать его более общим:

echo "${fields[-1]}" # prints the last item

baz 24.11.2017

arrow_upward
0
arrow_downward

Для тех, кто знаком с Python, хорошим выбором будет https://github.com/Russell91/pythonpy. чтобы решить эту проблему.

$ echo "a:b:c:d:e" | py -x 'x.split(":")[-1]'

Из справки pythonpy: -x treat each row of stdin as x.

С помощью этого инструмента легко написать код Python, который применяется к входным данным.

Изменить (декабрь 2020 г.): Pythonpy больше не в сети. Вот альтернатива:

$ echo "a:b:c:d:e" | python -c 'import sys; sys.stdout.write(sys.stdin.read().split(":")[-1])'

он содержит больше шаблонного кода (т.е. sys.stdout.read/write), но требует только std-библиотек из python.

Christoph Böddeker 19.02.2018

arrow_upward
-1
arrow_downward

Если вам нравится python и у вас есть возможность установить пакет, вы можете использовать эту утилиту python.

# install pythonp
pythonp -m pip install pythonp

echo "1:2:3:4:5" | pythonp "l.split(':')[-1]"
5

bombs 05.01.2019

comment

python может сделать это напрямую: echo "1:2:3:4:5" | python -c "import sys; print(list(sys.stdin)[0].split(':')[-1])" - MortenB; 06.03.2019

comment

@MortenB Вы ошибаетесь. Вся цель пакета pythonp - заставить вас делать то же самое, что и python -c, с меньшим количеством символов. Пожалуйста, посмотрите README в репозитории. - bombs; 08.03.2019

arrow_upward

arrow_downward

comment

Это приводит к проблемам, если в любом из полей есть пробелы. Кроме того, он не решает напрямую вопрос о получении поля last. - chepner; 22.06.2012

Как разбить строку в оболочке и получить последнее поле

Ответы (17)

Похожие вопросы