Verfügbare Detektoren
Der Tabellenerkennungsfilter kann verschiedene Techniken verwenden, um Tabellen in einem Dokument zu finden. Dieser Filter muss den Inhalt der Tabelle im Kontext der jeweiligen Zeilen, Spalten und Zellen vergleichen, wodurch falsch positive Unterschiede reduziert werden. Die Tabellenerkennung sollte für Dokumente verwendet werden, denen die Dokumentstruktur-Markierung fehlt.
Die verfügbaren Erkennungsmethoden unterscheiden sich hinsichtlich der Arten von Tabellen, die erkannt werden können, sowie hinsichtlich ihrer Leistung und Genauigkeit.
Tabellen anhand von Rahmen erkennen
Dieser Detektor findet Tabellen anhand ihrer visuellen Rahmen oder Zellenhintergründe. Das Erkennungsergebnis ist sehr genau, erfordert nur minimale Leistung und benötigt keine externen Tools, weshalb dieser Detektor für den Tabellenfilter immer aktiv ist.
KI-Modell für Tabellen
Das KI-Modell zur Tabellenerkennung verwendet ein lokales KI-Modell, um Tabellen zu finden, die keine sichtbaren Ränder haben und nur anhand der Struktur des Textinhalts identifiziert werden können. Dieser Ansatz ermöglicht die Erkennung von Tabellen, die vom Standarddetektor nicht identifiziert werden können. Die Verwendung des KI-Modells erfordert jedoch eine viel höhere Leistung als der Standarddetektor, weshalb es nur bei Bedarf für alle Benutzer verfügbar gemacht werden sollte.
Das KI-Modell ist auf externe Tools angewiesen, die installiert und konfiguriert werden müssen, damit dieser Detektor funktionsfähig ist.
Die Installation der erforderlichen Tools, Abhängigkeiten und KI-Modelle erfordert bis zu 1 GB Speicherplatz. Die Liste der erforderlichen Python-Abhängigkeiten finden Sie hier.
Hinweis: Bei Verwendung dieses Detektors werden die erforderlichen Abhängigkeiten und Modelle möglicherweise automatisch heruntergeladen und installiert.
Python-Installation
Das KI-Modell erfordert die Python-Laufzeitumgebung zur Ausführung. Diese Laufzeitumgebung muss installiert und für den Benutzer, der i-net PDFC ausführt, verfügbar sein.
Um Python zu installieren, gehen Sie wie folgt vor:
Windows
-
Python herunterladen
-
Besuchen Sie https://www.python.org/downloads/windows/ und laden Sie das neueste Python 3-Installationsprogramm herunter.
-
-
Führen Sie das Installationsprogramm aus
-
Führen Sie das Installationsprogramm als Administrator aus (Rechtsklick –> "Als Administrator ausführen").
-
Aktivieren Sie "Für alle Benutzer installieren", um den systemweiten Zugriff sicherzustellen.
-
Aktivieren Sie "Python zu PATH hinzufügen", um den Zugriff über die Befehlszeile zu ermöglichen.
-
-
Überprüfen Sie die Installation
-
Öffnen Sie die Eingabeaufforderung und führen Sie
python –versionaus, um zu überprüfen, ob Python verfügbar ist. -
Stellen Sie sicher, dass der Prozessbenutzer über Lese-/Ausführungsrechte für das Python-Installationsverzeichnis verfügt.
-
macOS
-
Python herunterladen
-
Besuchen Sie https://www.python.org/downloads/macos/ und laden Sie das macOS-Installationsprogramm für die neueste Version herunter.
-
-
Installationsprogramm ausführen
-
Öffnen Sie die Datei
.pkgund folgen Sie den Anweisungen. -
Das Installationsprogramm speichert Python automatisch unter
/Applications/Python X.Xund fügt es zu/usr/local/binhinzu, wo es für alle Benutzer zugänglich ist.
-
-
Installation überprüfen
-
Öffnen Sie das Terminal und führen Sie
python3 –versionaus. -
Stellen Sie sicher, dass der Prozessbenutzer über Ausführungsrechte für
/usr/local/bin/python3verfügt (die Standardberechtigungen sind in der Regel ausreichend).
-
Linux (Beispiel auf Ubuntu/Debian-Basis)
-
Python über den Paketmanager installieren
-
Öffnen Sie ein Terminal und aktualisieren Sie die Paketliste:
sudo apt update. -
Python installieren:
sudo apt install python3 python3-pip -y. -
Dadurch wird Python systemweit installiert, in der Regel unter
/usr/bin/python3.
-
-
Installation überprüfen
-
Führen Sie
python3 –versionaus, um dies zu bestätigen. -
Stellen Sie sicher, dass der Prozessbenutzer über Ausführungsrechte verfügt (Standard für
/usr/bin/python3).
-
-
Alternative (manuelle Installation)
-
Laden Sie die Quelle von python.org herunter, kompilieren Sie sie und installieren Sie sie mit folgendem Befehl in
/usr/local/bin:
-
tar -xzf Python-X.X.X.tar.gz cd Python-X.X.X ./configure --prefix=/usr/local make sudo make install
-
Überprüfen Sie dies mit
/usr/local/bin/python3 –version.
Modellinstallation
Das KI-Modell und die erforderlichen Abhängigkeiten werden bei der ersten Verwendung des Plugins automatisch heruntergeladen. Bei diesem Vorgang werden bis zu 1 GB zusätzliche Abhängigkeiten und das KI-Modell heruntergeladen.
Modellüberprüfung
Die Konfigurationsoption KI-Modell für Tabellen wird aktiviert, sobald i-net PDFC überprüfen kann, dass Python installiert ist und alle erforderlichen Abhängigkeiten sowie das KI-Modell verfügbar sind.
Falls eine der Voraussetzungen nicht erfüllt ist, wird eine Fehlermeldung angezeigt. Häufige Probleme sind:
-
Python ist installiert, steht dem Benutzer, der i-net PDFC ausführt, jedoch nicht zur Verfügung.
-
Eine Abhängigkeit fehlt. Stellen Sie eine Verbindung zum Internet her, damit die Abhängigkeit heruntergeladen werden kann.
