web-dev-qa-db-fra.com

Comment configurer le pom.xml de Tika pour qu'il cesse de recevoir tous les avertissements de dépendance de licence?

Je reçois tous ces avertissements de Tika quand j'essaie de l'utiliser:

24 février 2018 09:24:35 PM org.Apache.tika.config.InitializableProblemHandler $ 3 handleInitializableProblem AVERTISSEMENT: JBIG2ImageReader n'est pas chargé. Les fichiers jbig2 seront ignorés. Voir https://pdfbox.Apache.org/2.0/dependencies.html#jai-image-io pour les dépendances facultatives. TIFFImageWriter n'est pas chargé. Les fichiers tiff ne seront pas traités. Voir https://pdfbox.Apache.org/2.0/dependencies.html#jai-image-io pour les dépendances facultatives. J2KImageReader non chargé. Les fichiers JPEG2000 ne seront pas traités. Voir https://pdfbox.Apache.org/2.0/dependencies.html#jai-image-io pour les dépendances facultatives.

24 février 2018 09:24:35 PM org.Apache.tika.config.InitializableProblemHandler $ 3 handleInitializableProblem ATTENTION: le fichier sqlite-jdbc d'org.xerial n'est pas chargé. Veuillez fournir le fichier jar sur votre chemin de classe pour analyser les fichiers sqlite. Voir tika-parsers/pom.xml pour la version correcte.

J'ai essayé d'ajouter ceci (dans Tika pom.xml):

            <dependency>
                <groupId>org.bouncycastle</groupId>
                <artifactId>bcprov-jdk15on</artifactId>
                <version>1.57</version>
            </dependency>
            <dependency>
                <groupId>org.bouncycastle</groupId>
                <artifactId>bcmail-jdk15on</artifactId>
                <version>1.57</version>
            </dependency>
            <dependency>
                <groupId>org.bouncycastle</groupId>
                <artifactId>bcpkix-jdk15on</artifactId>
                <version>1.57</version>
            </dependency>
            <dependency>
                <groupId>log4j</groupId>
                <artifactId>log4j</artifactId>
                <version>1.2.17</version>
            </dependency>

            <dependency>
                <groupId>com.levigo.jbig2</groupId>
                <artifactId>levigo-jbig2-imageio</artifactId>
                <version>2.0</version>
                <scope>test</scope>
            </dependency>
            <dependency>
                <groupId>com.github.jai-imageio</groupId>
                <artifactId>jai-imageio-core</artifactId>
                <version>1.3.1</version>
                <scope>test</scope>
            </dependency>    
            <dependency>
                <groupId>com.github.jai-imageio</groupId>
                <artifactId>jai-imageio-jpeg2000</artifactId>
                <version>1.3.0</version>
                <scope>test</scope>
            </dependency>

            <dependency>
                    <groupId>org.xerial</groupId>
                    <artifactId>sqlite-jdbc</artifactId>
                    <version>3.20.1</version>
            </dependency>

Mais je reçois toujours les mêmes avertissements.

Comment résoudre ça?

UPDATE 1

Mes dépendances ont été ajoutées ici: https://github.com/Apache/tika/blob/1.17/pom.xml#L164-L170

Aussi, j'ai essayé sans le set à tester. Il n'a rien fait.

Les dépendances que j'ai ajoutées semblaient être pour PDFBox une dépendance de Tika.

4
jnbdz

J'ai ajouté les dépendances suivantes et je n'ai eu aucun autre avertissement

    <dependency>
        <groupId>org.Apache.tika</groupId>
        <artifactId>tika-core</artifactId>
        <version>1.18</version>
    </dependency>
    <dependency>
        <groupId>org.Apache.tika</groupId>
        <artifactId>tika-parsers</artifactId>
        <version>1.18</version>
    </dependency>
    <dependency>
        <groupId>org.Apache.pdfbox</groupId>
        <artifactId>jbig2-imageio</artifactId>
        <version>3.0.1</version>
    </dependency>
    <dependency>
        <groupId>com.github.jai-imageio</groupId>
        <artifactId>jai-imageio-jpeg2000</artifactId>
        <version>1.3.0</version>
    </dependency>
1
Domenico Campagnolo

ceci est maintenant documenté dans le journal des erreurs:

19 février 2019 15:18:44 PM org.Apache.tika.config.InitializableProblemHandler $ 3 handleInitializableProblem AVERTISSEMENT: J2KImageReader non chargé. Les fichiers JPEG2000 ne seront pas traités. Voir https://pdfbox.Apache.org/2.0/dependencies.html#jai-image-io Pour les dépendances facultatives.

Cependant, je préférerais une version de Tika (avec un classificateur, par exemple) qui n'inclut pas le traitement des images/OCR lorsque je ne souhaite analyser que le texte, ou une option permettant de désactiver la consignation des erreurs (et de consigner uniquement une erreur). en essayant de charger un format non supporté).

0
Gregor

Il est difficile de voir exactement ce qui se passe car vous n’avez pas inclus la totalité de votre section <dependencies>...</dependencies> dans votre pom.xml, mais je suppose que cela est dû à des dépendances optionnelles de maven. Selon maven docs , vous devez déclarer des dépendances facultatives dans votre pom, sinon elles ne seront pas chargées.

De plus, toutes vos dépendances imageio ont <scope>test</scope>, ce qui les rend utilisables uniquement lors des tests unitaires.

0
derfsubterfuge