クラス BinaryPDFParser

java.lang.Object
org.iplass.mtp.impl.fulltextsearch.parser.AbstractBinaryReferenceParser
org.iplass.mtp.impl.fulltextsearch.parser.BinaryPDFParser
すべての実装されたインタフェース:
BinaryReferenceParser

public class BinaryPDFParser extends AbstractBinaryReferenceParser

BinaryReferenceのコンテンツ解析Parser。 tikaのPDFParserを利用してPDFの解析を行う。

tika標準のPDF用ParserはJournalParserであるが、 内部で実行されるGrobidRESTParserはメタデータ情報を取得する目的のため、 Index生成用コンテンツ解析には不要。直接PDFParserを利用する。

  • コンストラクタの詳細

    • BinaryPDFParser

      public BinaryPDFParser()
  • メソッドの詳細