В наборе тегов Penn Treebank есть отдельный тег TO
для слова ' to', независимо от того, используется ли оно в смысле предлога (например, I went to school
) или в смысле инфинитива (например, I want to eat
). Какой цели это служит с общей точки зрения НЛП? Просто пометить инфинитив «to» отдельно интуитивно понятно, но я не вижу логики в объединении инфинитива и предлога в одном теге.
Спасибо и извините, если это не соответствует правилам переполнения стека.