У меня есть текстовый файл. Там сотни строк. Каждая строка написана либо английскими, либо китайскими иероглифами, но не обоими (есть несколько исключений, но, возможно, менее ‹10, так что их можно обнаружить и ими можно управлять). Одна строка может содержать несколько предложений. В итоге я хотел бы получить два файла; один на английском языке; другой на китайском.
Линии имеют тенденцию чередовать языки, но не всегда. Иногда могут быть две строки на английском языке, за которыми следует одна строка на китайском языке.
Есть ли способ использовать Sed или Awk для разделения языков на два разных текстовых файла?