Lassen Sie sich nicht von Presse -Workflows verlangsamen! Unser Selbst - entwickelte Tools steigert die Effizienz um fast 10 Mal
Entwicklungshintergrund: Ursprung aus den tatsächlichen Produktionsbedürfnissen
Die Verarbeitung von Pre -Press -Dokumenten für den Digitaldruck nimmt zu viel Zeit in Anspruch. Nach der Kommunikation mit den Front -Operatoren wurden drei Kernanforderungen identifiziert und bestätigt.
(1) Batch -Checking -Dokument -Seitennummern: Beim Druck und Typensatz muss häufig sichergestellt werden, dass die Dokumentseitennummern gleichzeitig sind, da sie sonst zu Verschwendung von Druckmaterialien oder Bindungsfehlern führen kann.
(2) Verarbeiten von ungeraden Seitendokumenten automatisch: Für Dokumente mit ungeraden Seiten sollte eine leere Seite am Ende einheitlich hinzugefügt werden, während Dokumente mit gleichmäßigen Seiten unverändert bleiben sollten.
(3) Batch -Überprüfung auf Textflexion: Um zu vermeiden, dass Druckfehler durch fehlende Schriftarten verursacht werden, muss bestätigt werden, ob der Text im Dokument in Kurven umgewandelt wurde (dh "Beugung").
Durch die Erforschung von Adobe Acrobat und verschiedenen PDF -Verarbeitungs -Plugins auf dem Markt wurde festgestellt, dass vorhandene Tools entweder über redundante und komplexe Funktionen verfügen oder nicht mit dem tatsächlichen Produktionsprozess des Unternehmens übereinstimmen, insbesondere in Bezug auf Sicherheitsrisiken bei der Konvertierung von Dateien. Noch wichtiger ist, dass im Inland erzeugte ähnliche Tools häufig eine Zahlung erfordern, was zu einer höheren Länge führt. Basierend auf den oben genannten praktischen Themen hat das Unternehmen beschlossen, ein leichtes, präzises und intern kompatibles spezielles Tool zu entwickeln.
PDF -Seitenüberprüfung und Verarbeitungstool
01
Kernfunktionen und Urteilslogik
Das Kernziel dieses Tools besteht darin, sicherzustellen, dass alle Seiten des zu druckenden Dokuments ausgedruckt werden, und der Urteils- und Ausführungsansatz ist wie folgt.
(1) Mechanismus für Seitenerkennung: Lesen Sie die Metadaten von PDF -Dokumenten über die PYMUPDF -Bibliothek, um die gesamten Seiteninformationen direkt zu erhalten.
(2) Paritätsurteilslogik: Verwenden Sie den Modulo -Betrieb (Seitenzahl% 2), um die Parität zu bestimmen. Wenn das Ergebnis 1 ist, wird es als eine seltsame Seite beurteilt, und wenn das Ergebnis 0 ist, wird es als eine gleichmäßige Seite beurteilt.
(3) Strategie zur Differenzierungsverarbeitung: Wenn es sich um ein ungerade nummeriertes Dokument handelt, fügen Sie automatisch eine leere Seite mit derselben Größe wie das Originaldokument am Ende des Dokuments hinzu; Wenn es sich um ein gleichmäßiges Seitendokument handelt, halten Sie den Inhalt unverändert und kopieren Sie ihn direkt in das Ausgabeverzeichnis.
(4) Prinzip der Sicherheitsverarbeitung: Alle verarbeiteten Dokumente werden in dem Verzeichnis "Verarbeitete Dateien" gespeichert, und die Originaldateien bleiben unverändert, um zu durch Fehloperationen verursachte Dateienschäden zu vermeiden, wie in Abbildung 1 gezeigt.
Abbildung 1 PDF -Seite Überprüfungs- und Verarbeitungswerkzeugschnittstelle
02
Schlüsselpunkte der technischen Implementierung
Das Tool erstellt TKINTER eine grafische Schnittstelle, die hauptsächlich drei Funktionsmodule enthält.
.
(2) Batch -Verarbeitungsmodul: Verwenden von Multi - Threaded -Technologie zur Implementierung der Backend -Verarbeitung, zur Vermeidung der Schnittstellenverzögerung und zur Anzeige des Verarbeitungsfortschritts in real - Zeit über eine Fortschrittsleiste.
(3) Ergebnisanzeigemodul: Präsentieren Sie die Verarbeitungsergebnisse jeder Datei in einem Tabellenformat, einschließlich der Original -Seitennummer, der Verarbeitungsaktionen und der Statusinformationen, und unterscheiden Sie zwischen erfolgreichen und fehlgeschlagenen Zuständen nach Farbe.
PDF -Konvertierungsprüfwerkzeug
01
Kernfunktionen und Urteilslogik
Das Curve Checking -Tool konzentriert sich darauf, festzustellen, ob der Text im Dokument in eine Kurve umgewandelt wurde, und seine Kernurteilslogik basiert auf der Analyse von Schriftarten in PDF -Dokumenten.
(1) Erkennung von Textvoreinheiten: Stellen Sie durch die Verwendung der Seitentxt -Extraktionsfunktion fest, ob das Dokument bearbeitbarer Text enthält.
(2) Schriftinformationsanalyse: Analysieren Sie die Liste der eingebetteten Schriftarten im Dokument. Wenn es Schriftinformationen gibt, zeigt dies an, dass der Text nicht konvertiert wurde.
(3) umfassende Urteilsregel: Wenn es Textinhalte, aber keine Schriftartinformationen gibt, zeigt dies an, dass das Lied konvertiert wurde (grün markiert); Kein Textinhalt, der angibt, dass keine Spuren (Green Label) wechseln müssen; Wenn es Textinhalt und Schriftinformationen gibt, zeigt dies an, dass das Lied nicht konvertiert wurde (rot markiert), wie in Abbildung 2 gezeigt.
Das Tool ist speziell für den Modus "Nur überprüft ohne Konvertierung" konzipiert, vor allem, da nach Feedback der Bediener bei der Durchführung des Konvertierungsvorgangs in Dateien, die offizielle Siegel enthalten, leicht den Verlust offizieller Siegel und anderer Muster verursachen können. Daher wird nur die Überprüfungsfunktion beibehalten.
Abbildung 2 PDF -Konvertierungsprüfwerkzeug
02
Schlüsselpunkte der technischen Implementierung
Mit diesem Tool wird auch TKINTER verwendet, um die Schnittstelle zu erstellen, und die wichtigsten technischen Punkte umfassen die folgenden drei Punkte.
(1) Extraktion für Schriftinformationen: Verwenden Sie die Textblockanalysefunktion von PYMUPDF, die Namen und Vorkommen aller im Dokument verwendeten Schriftarten erhalten.
(2) Ergebnisvisualisierung: Verwenden Sie eine Baumansicht, um die Inspektionsergebnisse anzuzeigen und verschiedene Zustände durch Farben und Symbole visuell zu unterscheiden.
(3) Funktionsstatistikfunktion: Berechnen Sie automatisch die Anzahl der Dateien, die den Anforderungen entsprechen, und hilft den Betreibern, die Gesamtinspektionssituation schnell zu erfassen.
Schwierigkeiten und Lösungen im Entwicklungsprozess
Als nicht professioneller Entwickler habe ich während des Tool -Entwicklungsprozesses viele technische Herausforderungen gestellt. Die spezifischen Probleme und Lösungen sind wie folgt.
(1) PDF -Parsing -Tiefenproblem: Die anfängliche PDF -Bibliothek konnte die Schriftinformationen nicht genau extrahieren. Nach der Empfehlung von AI wurde es gelöst, indem sie durch die PYMUPDF -Bibliothek ersetzt wurde.
, Mit der Anleitung von AI wurde eine Multi - -Rehread -Verarbeitungslösung implementiert, um dieses Problem effektiv zu lösen.
(3) Chinesische Anzeigen verstümmelten Zeichen: Durch Konfigurieren von Schriftartparametern und Codierungseinstellungen wurde das Problem der chinesischen Anzeige verstümmelte Zeichen in der Schnittstelle und exportierte Dateien gelöst.
(4) Ausnahmebehandlungsmechanismus: Als Reaktion auf das Problem der durch beschädigten PDF -Dateien verursachten Programmabstürze wurde ein Ausnahmebefehlmechanismus verbessert, um sicherzustellen, dass der Fehler der individuellen Dateiverarbeitung keinen Einfluss auf den Gesamtprozess hat.
Während des gesamten Entwicklungsprozesses spielten KI -Tools als technische Berater eine wichtige Rolle, die nicht nur wichtige Code -Beispiele bereitstellten, sondern auch die Prinzipien des PDF -Dateiformat -Parsens erläuterten und Entwicklern dazu beitragen, das kenntnisreicher Kenntnis der professionellen Domänen schnell zu verstehen.
Der Wert und die Aussicht auf Toolanwendung
Die Anwendung dieser beiden Tools hat die Produktionsarbeit erhebliche Effizienzverbesserungen mit sich gebracht, die sich in den folgenden beiden Aspekten widerspiegeln.
(1) Zeitkosteneinsparungen: Die manuelle Inspektionsarbeiten, die ursprünglich erforderlich war, kann jetzt in 5 Minuten abgeschlossen werden, was die Effizienz um fast das 10 -fache erhöht.
(2) Verbesserte Qualitätsstabilität: Effektiv vermeiden manuelle Inspektionsauslassungen und die stabile Druckqualität.
Die Aufzeichnung des Entwicklungsprozesses dieser beiden kleinen Instrumente zielt darauf ab, die Arbeitsphilosophie der "Erkundung und Innovation" zu vermitteln, sich auf die Lösung spezifischer Probleme in der tatsächlichen Produktion zu konzentrieren, traditionelle Workflows auf technologischen Mitteln zu optimieren und letztendlich das Ziel der Kostenreduzierung und der Verbesserung der Effizienz zu erreichen.

