Ocr – Qnovi Blog

OCR-Benchmark 2025: Die besten OpenSource Modelle im Praxistest

Nachdem wir im ersten Teil unserer Serie beleuchtet haben, wie sich LLM-basierte OCR grundlegend von klassischen Verfahren unterscheidet, und im zweiten Teil die technische Umsetzung beleuchtet haben, widmen wir uns nun der entscheidenden Frage der Modellwahl. Der Markt für Open-Source-Modelle bewegt sich rasant, und die Wahl des richtigen „Motors“ bestimmt maßgeblich über die Qualität und Effizienz der Pipeline.

Veröffentlicht 08. Februar 2026

Weiterlesen →

Digitalisierung OCR Guide

OCR für sensible Daten auf eigener GPU

In diesem zweiten Teil widmen wir uns der praktischen Implementierung dieser hochperformanten Pipeline. Wir zeigen Schritt für Schritt, wie man mithilfe von Podman (auf Rocky Linux) und der Inferenz-Engine vLLM einen dedizierten, schnellen Verarbeitungsserver auf Ihrer eigenen NVIDIA-GPU aufsetzen. Anschließend bauen wir einen asynchronen Python-Client, um die volle Leistung der GPU auszuschöpfen und so selbst große Dokumentenstapel zu verarbeiten.

Veröffentlicht 16. Dezember 2025

Weiterlesen →

Sprachmodelle OCR Digitalisierung

Wie LLMs die OCR-basierte Dokumentenanalyse revolutionieren

In diesem ersten Teil beleuchten wir die konzeptionellen Vorteile von Large Language Models (LLMs) in der Dokumentenanalyse. Die technische Implementierung und die praktischen Code-Beispiele der gegenübergestellten Pipelines folgen detailliert in einem begleitenden Artikel.

Veröffentlicht 02. Dezember 2025

Weiterlesen →