Durchsuchbare Dokumentation aufrufen | Zurück zur Dokumentationsübersicht
Navigation: Dokumentationen agorum core > agorum core Module und Plugins > ALBERT | AI Agents
Hinweis: Diese Dokumentation bezieht sich auf die aktuellste Version des Plugins ALBERT | AI Agents. Aktualisieren Sie das hier beschriebene Plugin, um die Dokumentation verwenden zu können.
ALBERT | AI Agents erlaubt, Dokumente (PDFs und Bilder) direkt im Chat per OCR (Optical Character Recognition) zu analysieren. Die KI erkennt dabei Text, Tabellen, Layoutstrukturen und weitere Elemente und gibt das Ergebnis zurück. Das Ergebnis ist sofort bereit zur Weiterverarbeitung, Zusammenfassung oder Datenextraktion.
Je nach Konfiguration stehen Ihnen verschiedene OCR-Anbieter zur Verfügung. Welche Tools in Ihrem Chat aktiv sind, legt Ihr Administrator fest.
Gehen Sie wie folgt vor, um ein Dokument im Chat per OCR zu analysieren:
Tipp: Sie müssen sich nicht um die Wahl des OCR-Tools kümmern – die KI entscheidet anhand der verfügbaren Tools automatisch. Wenn Sie ein bestimmtes Tool bevorzugen, können Sie dies in Ihrer Anweisung angeben, z. B.: „Analysiere dieses Dokument mit PaddleOCR“ oder „Verwende Mistral OCR für dieses PDF“.
| Kategorie | Formate |
|---|---|
| PDF-Dokumente (auch mehrseitig). Große PDFs werden je nach Tool automatisch in Abschnitte aufgeteilt und seitenweise verarbeitet. | |
| Bilder | JPG, JPEG, PNG, GIF, BMP, TIF, TIFF, WebP, AVIF |
Je nach OCR-Tool werden große PDFs unterschiedlich behandelt:
In beiden Fällen müssen Sie nichts Besonderes tun. Die Verarbeitung erfolgt im Hintergrund.
Das Ergebnisformat hängt vom verwendeten OCR-Tool ab:
| Tool | Format | Besonderheiten |
|---|---|---|
| PaddleOCR | HTML | Tabellen als <table>-Markup, Formeln mit <sup>/<sub>, strukturierte Layoutblöcke |
| Mistral OCR | Markdown | Text, Tabellen, eingebettete Bilder als Markdown-Syntax |
Unabhängig vom Format kann die KI das Ergebnis direkt weiterverarbeiten, z. B. um Tabellen zu extrahieren, Inhalte zusammenzufassen oder Daten zu analysieren.
ALBERT | AI Agents unterstützt mehrere OCR-Anbieter. Welche in Ihrem Chat verfügbar sind, hängt von der Konfiguration durch Ihren Administrator ab.
| Merkmal | PaddleOCR | Mistral OCR |
|---|---|---|
| Betriebsmodell | Self-Hosted (eigener Server) | Cloud-Dienst (Mistral API) |
| Datenschutz | Dokumente verlassen nicht Ihr Netzwerk | Dokumente werden an Mistral-Server gesendet |
| Ergebnisformat | HTML (strukturiert mit Tabellen-Markup) | Markdown |
| Einrichtung | PaddleOCR-VL-Server muss bereitgestellt werden | Nur API-Key erforderlich |
| Große PDFs | Automatisches Chunking (10er-Batches) | Verarbeitung aller Seiten in einem Aufruf |
| Layout-Erkennung | Tabellen, Formeln, Diagramme, Layoutblöcke | Text, Tabellen, Bilder |
| Ideal für | Datenschutzsensible Umgebungen, On-Premises-Betrieb | Schnelle Einrichtung ohne eigene Infrastruktur |
Tipps: