Как извлечь текст из pdf-документа с помощью MuPDF на Android

Я пытаюсь извлечь текст из файла PDF, используя библиотеку MuPDF на платформе Android.

Можно ли извлечь текст внутри прямоугольника, заданного координатами (слева, сверху, справа, снизу)?

Примечание: я не собирал библиотеку из исходников. Я использую скомпилированные библиотеки, которые распространяются в https://github.com/libreliodev/android.


person Halil    schedule 21.08.2014    source источник
comment
Есть ли ответ на этот вопрос? Вы нашли способ получить текст, указав координаты слева, сверху, справа и снизу?   -  person Naresh    schedule 28.07.2015


Ответы (2)


да, конечно, вот как вы можете сделать.

1. Активность сгенерированного текста

public class GeneratedText extends Activity {

private Button close;
private Button clear;
private TextView tv;
private String data;
String text = "";
Intent i;
Context mContext;
  //    MuPDFPageView pdfview = new MuPDFPageView(mContext, null, null);
    private EditText edit;
private Button undo;
public static GeneratedText screen;


@Override
protected void onCreate(Bundle savedInstanceState) {
    super.onCreate(savedInstanceState);
    setContentView(R.layout.activity_generated_text);

    close = (Button)findViewById(R.id.close);
    clear = (Button)findViewById(R.id.clear);
    tv = (TextView)findViewById(R.id.text1);
    edit = (EditText)findViewById(R.id.edit);
    undo = (Button)findViewById(R.id.undo);
    undo.setEnabled(false);

    i = getIntent();

    data = i.getStringExtra("data");


    tv.setText(data);
    String mypattern = "Name and address of the Employee \n";

    Pattern p = Pattern.compile(mypattern,Pattern.DOTALL);
    if(data.matches(mypattern))
    {
        System.out.println("Start Printing name");
    }
    else
        //do nothing

    edit.setText(data);
    System.out.println("hello user "+"/n"+"user1"+ "\n"+ "user2");

    SharedPreferences pref = getSharedPreferences("key", 0);
    SharedPreferences.Editor editor = pref.edit();
    editor.putString("text", data);
    editor.commit();


    clear.setOnClickListener(new OnClickListener() {

        @Override
        public void onClick(View v) {
            // TODO Auto-generated method stub
            tv.setText("");
            edit.setText("");
            undo.setEnabled(true);
        }
    });
    close.setOnClickListener(new OnClickListener() {

        @Override
        public void onClick(View v) {
            // TODO Auto-generated method stub
            finish();
        }
    });
    undo.setOnClickListener(new OnClickListener() {

        @Override
        public void onClick(View v) {
            // TODO Auto-generated method stub
             String value = "";
            SharedPreferences pref = getSharedPreferences("key", 0);
            value = pref.getString("text", value);
            edit.setText(value);
            tv.setText(value);
            undo.setEnabled(false); 
        }
    });

}
}

1. теперь в mupdfactivity пишем это

public void Showtext( )
{
    destroyAlertWaiter();
    core.stopAlerts();

    MuPDFPageView pdfview = new MuPDFPageView(MuPDFActivity.this, core, null);
    String data = "";
    pdfview.setFocusable(true);
    data = pdfview.getSelectedText();
    Intent i = new Intent(getApplicationContext(),GeneratedText.class);
    i.putExtra("data",data);

    startActivity(i); 

}

вызвать Showtext в OnAcceptButtonClick

и вы получите свой текст.

person Kumar    schedule 22.08.2014
comment
Этот пример извлекает выделенный текст из pdfView и отображает его в действии GeneratedText, верно? - person Halil; 22.08.2014

Да, можно извлечь текст из документа PDF с помощью библиотеки MuPDF. В mupdf.c есть метод text(), определенный в MuPDFCore.java, который возвращает текст страницы. Вам нужно вызвать этот метод постранично. Шаги: 1. gotopage(номер страницы) 2. text()

person Ganesh Kanna    schedule 19.08.2015