pdaut

    教科書から構造化された知識まで - PDFS、解き放たれました

    注目
    5 投票
    pdaut - 教科書から構造化された知識まで -  PDFS、解き放たれましたメディア1
    pdaut - 教科書から構造化された知識まで -  PDFS、解き放たれましたメディア2
    pdaut - 教科書から構造化された知識まで -  PDFS、解き放たれましたメディア3

    説明

    PDUUTは、学生と研究者向けに構築されたオープンソースPDF抽出器です。ページごとの本を分割し、テキスト、方程式、および図を構造化されたJSONにキャプチャします。これは、RAGデータセットに最適です。私たちに参加して、貢献し、学習をアクセスしやすくしてください!

    推奨製品