org.annolab.tt4j — Поиск учебника по чанкингу

Я пытаюсь понять, как использовать TreeTagger

http://www.ims.uni-stuttgart.de/projekte/corplex/TreeTagger/

завернутый tt4j

http://recart.github.io/tt4j/

фрагментировать некоторый текст.

Я не могу найти учебник.

Спасибо за помощь


person LucaT    schedule 28.11.2011    source источник
comment
stackoverflow.com/ вопросы/15503388/   -  person alvas    schedule 19.03.2013


Ответы (1)


Страница tt4j была обновлена ​​полезным кодом для начала работы:

import org.annolab.tt4j.*;
import static java.util.Arrays.asList;

public class Example {
        public static void main(String[] args) throws Exception {
                // Point TT4J to the TreeTagger installation directory. The executable is expected
                // in the "bin" subdirectory - in this example at "/opt/treetagger/bin/tree-tagger"
                System.setProperty("treetagger.home", "/opt/treetagger");
                TreeTaggerWrapper tt = new TreeTaggerWrapper<String>();
                try {
                        tt.setModel("/opt/treetagger/models/english.par:iso8859-1");
                        tt.setHandler(new TokenHandler<String>() {
                                public void token(String token, String pos, String lemma) {
                                        System.out.println(token + "\t" + pos + "\t" + lemma);
                                }
                        });
                        tt.process(asList(new String[] { "This", "is", "a", "test", "." }));
                }
                finally {
                        tt.destroy();
                }
        }
}

Такого pom.xml (Maven) должно быть достаточно, чтобы он заработал:

    <project xmlns="http://maven.apache.org/POM/4.0.0" xmlns:xsi="http://www.w3.org/2001/XMLSchema-instance"
  xsi:schemaLocation="http://maven.apache.org/POM/4.0.0 http://maven.apache.org/xsd/maven-4.0.0.xsd">

  <dependencies>
    <dependency>
  <groupId>org.annolab.tt4j</groupId>
  <artifactId>org.annolab.tt4j</artifactId>
  <version>1.1.0</version>
      <type>jar</type>
    </dependency>
  </dependencies>

  <modelVersion>4.0.0</modelVersion>

  <groupId>gk2go</groupId>
  <artifactId>gk</artifactId>
  <version>1.0-SNAPSHOT</version>
  <packaging>jar</packaging>

  <name>gk</name>
  <url>http://maven.apache.org</url>
</project>

Весь приведенный выше код был адаптирован, поэтому не тестировался как есть.

person simpatico    schedule 22.06.2012