Den Mitarbeiter nicht stören
Ich habe eine Anfrage für Statistiken am Arbeitsplatz erhalten.
Eine Excel-Tabelle mit relevanten Daten.
Wie füllen wir diese Excel-Tabelle?
Derjenige, der mich nach weiteren Statistiken gefragt hat, ist ein exzellenter Datenerfasser: Er hat selbst eine eigene Tabelle mit schönen Notizen über alles, was er tut.
In seiner Tabelle messen die Prozentsätze verschiedene Arten von Effizienzmetriken und färben den Computerbildschirm klar ein.
Wie können wir die anderen Mitarbeiter davon überzeugen, auch exzellente Datenerfasser für statistische Zwecke zu sein?
In unserem Gespräch habe ich den Ansatz der Skepsis gegenüber dem Ausfüllen von Daten verwendet: Selbst wenn man schöne Formulare erstellt, wer garantiert, dass alle Mitarbeiter immer die relevanten Zahlen ausfüllen, um eine Statistik für den gesamten Sektor zu erstellen?
Meine skeptische Sichtweise antwortete: Niemand garantiert das. Im Gegenteil, es ist fast sicher, dass jemand eines Tages keine Daten ausfüllen wird, oder viele Mitarbeiter, viele Daten, besonders im Laufe der Zeit. Nach einigen Jahren ist die Wahrscheinlichkeit, dass die zusätzliche Anstrengung nicht ganz oder nur teilweise stattfindet, fast 100 %.
Wir befanden uns in dieser Sackgasse: Die Statistik ist sehr wichtig und muss für den gesamten Sektor gelten. Wir dürfen nicht im Zweifel darüber sein, ob jemand etwas nicht ausgefüllt hat, wenn wir die Statistik des gesamten Sektors veröffentlichen.
Eine parallele Anforderung war die Rückverfolgbarkeit von Dokumenten: Wir mussten Dokumente schnell durchsuchen können und konnten die Tabellen, die Statistiken erstellen, auch verwenden, um nach Dokumentennummern zu suchen.
Hier wird das Problem der unsicheren Teilnahme noch größer: Wenn Zweifel bestehen, ob ein einziger Mitarbeiter die Tabelle nicht ausgefüllt hat, wie können wir dann sagen, dass wir das Dokument nicht gefunden haben, wenn wir nicht sicher sind, ob alle Mitarbeiter die Tabelle immer ausfüllen?
Wir ließen unsere Gehirne ein wenig heiß laufen, Synapsen arbeiteten.
Es tauchte eine Lösung auf, die ich nicht nur für elegant und funktional halte, sondern auch für delikat, respektvoll und wirklich automatisiert, die niemanden stört.
Dieser Sektor hat nur eine Gewissheit in seiner gesamten Produktionslinie: Am Ende wird ein Gutachten erstellt.
Wie das Gutachten erstellt wird, ob parallele Tabellen oder Formulare ausgefüllt werden oder nicht, in welcher Zeit, mit welchen Ressourcen, all das ist nicht sicher. Es gibt eine Freiheit bei der Produktion, da es sich um einen Bereich handelt, der Intelligenz und Analyse erfordert, in dem jeder Mitarbeiter seine eigene Methode hat, um zum Endergebnis zu gelangen.
Das Endergebnis ist jedoch sicher: ein Gutachten. Als PDF.
Es kann über Word, über Google Doc oder auf andere Weise erstellt worden sein. Aber am Ende wird es ein schönes Gutachten im PDF-Format sein.
Also gut: Wir werden eine Maschine für nicht mehr als tausend Dollar anschaffen, mit viel RAM, einer guten NVIDIA-Grafikkarte und einer guten CPU, um lokal eine künstliche Intelligenz zu betreiben - nur um die Gutachten aus dem Web zu halten. Ja, es wäre in diesem Fall einfach, auf jeder einfachen Maschine eine Abfrage einer künstlichen Intelligenz über eine API zu implementieren. Aber wir haben uns für die lokale künstliche Intelligenz entschieden.
Ein Python-Skript überwacht den Netzwerkordner, der alle fertigen PDF-Gutachten des Sektors empfängt.
Wenn ein neues Gutachten erscheint, extrahiert die künstliche Intelligenz die Felder, die wir benötigen, um Statistiken zu erstellen.
Da die Art und Weise, Gutachten zu verfassen, sehr unterschiedlich ist, habe ich mich entschieden, keine Regex zu verwenden oder es zu versuchen.
Ich gestehe, dass es möglich wäre, eine gute Regex an die Variationen der Schreibweisen von Gutachten anzupassen, aber in Wirklichkeit wollte ich einen anderen Vorteil: die Skalierbarkeit in zwei Aspekten:
Die Lösung ist leistungsfähiger, als wir uns bei der Bewältigung des anfänglichen Problems vorgestellt hatten. Mit dieser Lösung wurde sogar eine Eins-zu-viele-Beziehung zum ersten Mal im Sektor implementiert. Da die künstliche Intelligenz ein Array (ein Set, um Duplikate zu entfernen) zurückgibt, wenn es viele Dinge vom gleichen Typ zu beantworten gibt, erstellen wir jetzt Statistiken und Möglichkeiten, schnell Elemente zu finden, die in unbestimmten Mengen für jedes Gutachten vorkommen.
In diesem Fall haben wir ein neues Register in der Tabelle erstellt und alle Elemente des von der künstlichen Intelligenz zurückgegebenen Arrays neben dem eindeutigen Wert hinzugefügt, der bestimmt, zu welcher Zeile der Haupttabelle diese Elemente gehören.
Eines dieser Elemente wird von denjenigen, die Informationen vom Sektor anfordern, sehr gesucht, daher wird diese Innovation den Prozess des gesamten Sektors und derjenigen, die den Sektor konsultieren, beschleunigen.
Klar, wir könnten eine SQL-Datenbank oder einen anderen Typ verwenden; wir könnten Google-Tabellen verwenden, verschiedene Optionen.
Ich habe es vorgezogen, das beizubehalten, was die Mitarbeiter im Alltag gewohnt sind zu sehen.
Diese Art von Lösung macht mich so zufrieden, wissen Sie warum?
Weil die Mitarbeiter die Lösung nicht einmal bemerken werden.
Sie werden ihr Leben nicht verändern.
Wenn sie sich eines Tages ändern wollen, weiß ich, dass es eine Personalabteilung gibt, oder sie können sich selbst treffen und sich ändern.
Aber ich bin es nicht, der Bewunderer von Technologien, der einen Mitarbeiter oder einen ganzen Sektor auffordern wird, sich zu ändern.
Wenn ich so diskret sein kann wie ein Marienkäfer, der sich auf einen Ort setzt, niemand sieht ihn, leicht, aber er bringt viel Glück - oder Statistiken und Rückverfolgbarkeit - möchte ich der Marienkäfer sein, den niemand bemerkt!
Einen schönen Tag euch allen! ☀️☀️☀️☀️