Weihnachten und Künstliche Intelligenz (Teil 2)

Wie schnell doch die Zeit vergeht! Nun ist bald schon wieder Weihnachten und auch das Jahr 2019 neigt sich dem Ende entgegen. Vor langer langer Zeit habe ich in einem Blog verschiedene Lösungen zur Bilderkennung mit frei verfügbaren Services aus dem Internet vorgestellt – vielleicht erinnern sich ja einige von euch noch daran. Inzwischen ist viel Zeit vergangen und auch im Bereich der Bilderkennung hat sich einiges getan – möchte man glauben. Deshalb hat es mich schon interessiert, wie sich die freien Services zur Klassifizierung von Bildmerkmalen im Internet weiterentwickelt habe.

Als erstes habe ich dazu mir ein neues Bild besorgt – ein Screenshot aus dem Coca Cola-Werbevideo (https://www.youtube.com/watch?v=0NmnRLNr6dc) –> wir wollen doch beim Thema bleiben und für viele ist der Coco Cola-Weihnachtsmann das Sinnbild für den Weihnachtsmann überhaupt. Mir geht es nicht darum, hier Schleichwerbung für diesen Konzern zu machen, doch irgendein Bild brauchte ich.

ColaVideo

Nachdem die Aufnahme recht dunkel und ein Screenshot aus einem Video ist, gehe ich davon aus, dass die verschiedenen Services damit ggf. Probleme bekommen werden – so leicht wollen wir es ihnen ja auch nicht machen.

Die Reihenfolge der Services in diesem Blogbeitrag richtet sich nach der Reihenfolge in meinem letzten Blog und soll keine Wertung der Qualität der Services darstellen.

Microsoft Azure

Microsoft bietet ein sehr umfangreiches Portfolio von Cognitive Services in Azure an, das jedes Jahr um neue Services erweitert wird und bestehende Services werden optimiert.

Azure_Cognitive_ServicesLogo 

Das aktuelle Portfolio an Services sieht so aus:

Azure_Cognitive_Services_Overview
Quelle: https://docs.microsoft.com/de-de/azure/cognitive-services/

und für die geplante Aufgabe habe ich, genau wie beim letzten Mal, den Service “Maschinelles Sehen” verwendet. Auf Seite https://azure.microsoft.com/de-de/services/cognitive-services/computer-vision/ findet ihr einen Testbereich, auf dem ihr vorgegebene Bilder und auch eigene Bilder analysieren könnt.

Auf diese Seite habe ich das Bild geladen und folgendes Ergebnis erhalten:

Azure

Die Ergebnisse der Analyse in Azure findet ihr auf der rechten Site des Screenshots. Dort befindet sich eine Liste der Objekte und Attribute, die der Service erkannt hat. Als zusammenfassende Beschreibung hat der Azure Service erkannt: “ein Mann mit einem roten Hut, der in die Kamera schaut” (a man wearing a hat and looking at the camera). In den Tags findet man noch den Weihnachtsbaum (chrismas tree). Prinzipiell wohl richtig! Doch so richtige Weihnachtsstimmung kommt damit wohl nicht auf.

Amazon AWS

Amazon AWS bietet ebenfalls einen solchen Dienst, mit dem ihr kostenlos Bilder analysieren lassen könnt. Den Dienst findet ihr unter https://us-west-2.console.aws.amazon.com/rekognition/home?region=us-west-2#/label-detection. Jedoch ist es vorher erforderlich, dass ihr euch bei AWS registriert.

AWS

Wie ihr auf dem Screenshot sehen könnt, liefert Amazon keinen zusammenfassenden Text, sondern nur Stichworte und die dazugehörende Wahrscheinlichkeit. Ich versuche mal mein Glück und bilde aus den von Amazon erkannten Labels einen Satz zu bilden, was auf dem Foto zu sehen ist: ein menschliches Gesicht mit Bart, das zu einer bekleideten Person gehört und einen pflanzlichen Weihnachtsbaum. Das ganze könnte als Portraitfoto bezeichnet werden –> aber da ist sich die KI von Amazon nicht sicher (70% ist wohl eher geraten).

IBM Watson

Auch bei IBM ist eine kostenlose Anmeldung erforderlich, wenn man Bilder testweise analysieren lassen möchte. Der Dienst kann unter https://visual-recognition-demo.ng.bluemix.net/ genutzt werden.

Watson

Die Erkennungsrate von Watson hat mich etwas enttäuscht. Wahrscheinlich habe ich einen schlechten Tag von ihm erwischt, denn mit 74% eine Kopfbedeckung zu erraten, würde ich nicht wirklich als vertrauenswürdige Aussage bezeichnen.

Clarify

Der Service von Clarify steht kostenlos für einzelne Bilder zur Verfügung https://www.clarifai.com/demo. Die Nutzung ist schnell und einfach…

Clarify

und das Ergebnis ist sehr beeindruckend, genau wie beim letzten Mal –> das hier Weihnachten nur noch mit einer Wahrscheinlichkeit von 99,9% erkannt wurde (im Vergleich zu dem Ergebnis von vor 2 Jahren, denn da waren es 100%), liegt wohl nur an der schlechten Qualität des Bildes Smile

Google

Der Dienst von Google https://cloud.google.com/vision/docs/drag-and-drop?hl=de, der ebenfalls kostenlos genutzt werden kann, verweigert auf dem Internet Explorer zwischenzeitlich den Dienst (doch vielleicht auch nur auf meinem Notebook) und so musste ich, als einzigen Kandidaten in dem Feld, auf Edge ausweichen.

Google

Dieses Mal hat die Google-KI den Weihnachtsmann sogar mit 95%iger Sicherheit erkannt (das letzte Mal waren es nur 87%). Auch mit dem anderen Treffern bin ich sehr zufrieden und widerlegt wohl auch meine These vom letzten Mal, dass “Googles Augen dieses Bild bereits einmal gesehen haben”. Somit ist die Google-Erkennung einer meiner Favoriten.

CloudSight

Mit diesem Dienst https://cloudsight.ai/ .lassen sich leider nicht mehr beliebige Bilder klassifizieren und so musste ich zu den vorgegebenen Testbildern auf der Seite ausweichen. Nachdem Weihnachten ist, habe ich mich für ein kleines Bild entschieden, dass bestimmt für einige ein perfektes Weihnachtsgeschenk darstellen würde:

Cloudsight

Die Aussage “Ein Amethystring im Ovalschliff mit einem Diamantkranz” würde ich auch als nicht Juwelier sofort bestätigen

Imagga

Imagge ist ein neuer Dienst und steht unter https://imagga.com/auto-tagging-demo und steht kostenlos und ohne Anmeldung zur Verfügung.

imagga

Die Erkennungsrate bei dem von mir gewählten Bild war leider sehr gering, deshalb würde ich diesen Dienst derzeit nicht zur Erkennung von Weihnachtsbildern – insbesondere solchen, auf denen der Weihnachtsmann zu sehen ist – verwenden.

Eyeem

Das Unternehmen ist als globale Fotocommunity bekannt und bietet auf einem Marktplatz Fotografen die Möglichkeit Fotos zu verkaufen. Als weiteren Dienst bietet das Unternehmen seit einiger Zeit auch die Möglichkeit Fotos mit Tags sowie konkreten Begriffen und Schlüsselwörtern versehen. Der Dienst steht unter https://www.eyeem.com/eyeem-vision zur Verfügung und kann kostenfrei und ohne Anmeldung genutzt werden.

Eyeem

Die vorgeschlagenen Tags für das Bild sind meiner Meinung nach sehr gut, da bereits an erster Stelle Weihnachten steht. Das der Weihnachtsmann hier etwas zu kurz kommt und nur noch auf Tag-Platz 10 landet, liegt vielleicht an der suboptimalen Bildqualität.

Zusammenfassung

Alle von mir in meinem letzten Blogeintrag zu diesem Thema getesteten Dienste stehen weiterhin zur Verfügung und die Qualität der Erkennung von Objekten auf Bildern hat sich noch weiter verbessert. Zusätzlich zu den vormals betrachteten Diensten gibt es zwischenzeitlich neue Player am Markt, die ebenfalls eine sehr gute Qualität der Erkennung liefern.

Mein Ziel war es auch dieses Mal nicht, einen kompletten Überblick über alle am Markt verfügbaren Services zur Erkennung von Bildern zu geben. Mir ging es in erster Linie darum, zu vermitteln, dass die Qualität der Erkennung mit vorgefertigten Modellen bereits sehr hoch ist. Diese Qualität reicht sicherlich in den meisten Fällen aus, um die heimische Fotosammlung zu klassifizieren. Für den produktiven Einsatz in einem Unternehmen empfehle ich jedoch eher den Einsatz eines auf das spezielle Aufgabengebiet trainierte Modell. Für solche Aufgaben im Unternehmenskontext würde ich aber eher von einer cloudbasierten Lösung abraten, da hierbei möglicherweise hohe Kosten auf euch zukommen, wenn mehrere Millionen Bilder zu analysieren sind.

Bei meiner Recherche zu diesem Artikel bin ich auch auf Speziallösungen gestoßen, wie bspw. Talkwalker AI die zur Suche von Copyright-Verstößen in Bildern eingesetzt werden kann. Im Werbetext dazu steht: “Unsere inhouse entwickelte Bilderkennungstechnologie findet für Ihre Suche alle relevanten visuellen Ergebnisse. Dank der marktweit größten Datenbank an Markenlogos, Produktabbildungen, Objekten und Hintergründen mit über 30.000 vordefinierten Modellen. So spüren Sie alle Fotos in sozialen Netzwerken, Blogs oder Webseiten auf, in denen Ihre Marke auftaucht.” https://www.talkwalker.com/de/kuenstliche-intelligenz

Doch auch im Handy-Bereich gibt es einige interessante Apps, die sehr gut in der Lage dazu sind, Fotos zu klassifizieren wie bspw. Google Lens https://lens.google.com/ oder V7 AiPoly https://www.aipoly.com/. Jedoch trifft man auch dort Speziallösungen wie bspw. Pl@ntNet https://plantnet.org/en/, das zur Erkennung von Pflanzen dient und dies auch sehr gut macht.

Des Weiteren gibt es für die Softwareentwickler unter euch spezielle Frameworks (teilweise auch ohne Nutzung von Cloud-Diensten), die euch bei der Erstellung von Modellen und Bildanalysen unterstützen. Ein Beispiel dafür ist das neuraltalk2 Framework https://deepai.org/machine-learning-model/neuraltalk oder https://cs.stanford.edu/people/karpathy/neuraltalk2/demo.html, dass per Rest-API aufgerufen werden kann. Solche Frameworks lasse sich in eigene Anwendungen integrieren und mit bestehenden Lösungen kombinieren.

Zum Schluss: …und da nun Weihnachten vor der Tür steht, wünsche ich allen meinen Lesern ein besinnliches Weihnachtsfest und einen guten Start in das neue Jahr. Vielen Dank, dass ihr meinem Blog bis heute treu geblieben seid. Ich würde mich sehr darüber freuen, wenn es euch auch im kommenden Jahr wieder Ab und Zu auch diese Seite zieht. Bis dahin eine schöne und friedliche Zeit. Euer Sylvio!

Über

Die IT-Welt wird immer komplexer und zwischen den einzelnen Komponenten gibt es immer mehr Abhängigkeiten. Nachdem ich durch meine tägliche Arbeit immer wieder vor der Herausforderung stehe, komplexe Probleme zu lösen, möchte ich diese Seite dafür verwenden, Euch den einen oder anderen Tipp zu geben, wenn Ihr vor ähnlichen Aufgabenstellungen steht.

Veröffentlicht in Bilderkennung, Künstliche Intelligenz

Kommentar verfassen

Trage deine Daten unten ein oder klicke ein Icon um dich einzuloggen:

WordPress.com-Logo

Du kommentierst mit Deinem WordPress.com-Konto. Abmelden /  Ändern )

Google Foto

Du kommentierst mit Deinem Google-Konto. Abmelden /  Ändern )

Twitter-Bild

Du kommentierst mit Deinem Twitter-Konto. Abmelden /  Ändern )

Facebook-Foto

Du kommentierst mit Deinem Facebook-Konto. Abmelden /  Ändern )

Verbinde mit %s

Follow Sylvio's Infobox on WordPress.com
Dezember 2019
M D M D F S S
 1
2345678
9101112131415
16171819202122
23242526272829
3031  
%d Bloggern gefällt das: