Anonim

Was sind Bilderkennungs-APIs und was können sie für Sie tun? In diesem Artikel wird erläutert, was Bilderkennung ist, was eine API bewirkt und wie Sie oder Ihr Unternehmen mehr aus dem Internet herausholen können. Die Bilderkennung hat ein großes Potenzial für Unternehmen und für einzelne sehbehinderte Internetnutzer.

Was ist eine Bilderkennungs-API?

Bei der Bilderkennung erkennt eine Software die Merkmale eines Bildes und kategorisiert es genau. Wenn Sie beispielsweise ein Bild eines Ferrari 458 auf eine Bilderkennungs-API hochladen, sollte diese erkennen, dass es sich um ein Auto handelt und dass es rot ist (oder sein sollte). Abhängig von der API kann je nach verwendetem Bildtyp eine weitere Klassifizierung möglich sein.

Das mag sehr einfach erscheinen - Menschen können sich ein Bild ansehen und sagen, worum es sich handelt, ohne es zu versuchen -, aber dies war ein schwieriges Problem, dem Computer das Lösen beizubringen. Es wurde viel Arbeit investiert, um herauszufinden, wie ein Computer verstehen kann, wie die Dinge aussehen, und wir haben große Fortschritte erzielt, von der Möglichkeit der umgekehrten Bildsuche bis zum berühmten Deep Dream-Netzwerk von Google.

Eine API ist eine Anwendungsprogrammschnittstelle. Es handelt sich im Wesentlichen um einen Mittelsmann zwischen Programmroutinen, der einem Element sagt, wie es mit einem anderen Element arbeiten soll, oder die Tools bereitstellt, die zur Ausführung einer Funktion erforderlich sind. Es gibt Dutzende von API-Typen, die mit einer Reihe von Programmiersprachen alle möglichen Ziele erreichen können. In diesem Zusammenhang ist eine Bilderkennungs-API das Werkzeug, mit dem Sie auf die umfassende Lernleistung einiger kommerzieller Bilderkennungssysteme zugreifen können.

Sie benötigen viel Rechenleistung, um eine Bilderkennung durchzuführen. Sie brauchen eine Menge Daten und die Kraft, um alles zu interpretieren. Die meisten Benutzer haben einfach nicht die enormen Ressourcen, um ihre eigene Deep-Learning-Maschine zu erstellen. Große Namen wie die Vision-API von Google, die Face-API von Microsoft, ImageNet und andere verfügen über solche Maschinen und ermöglichen den Zugriff über APIs, entweder kostenlos oder gegen eine Gebühr. Auf diese Weise können Unternehmen jeder Größe auf diese Leistung zugreifen, und Benutzer erhalten dadurch neue Erfahrungen.

Wie wird die Bilderkennung unsere Interneterfahrung verändern?

Verschiedene Internetnutzer erhalten unterschiedliche Vorteile durch die Bilderkennung. Schauen wir uns einen hypothetischen Websitebesitzer und einen hypothetischen Benutzer an, um zu sehen, wie beide Seiten davon profitieren können.

Die geschäftlichen Vorteile der Bilderkennung

Nehmen wir als Beispiel an, Sie betreiben ein Self-Selling-Portal ähnlich wie Etsy oder eine Dating-Website. Sie möchten die Qualität und Eignung aller von Benutzern hochgeladenen Bilder verwalten. Sie möchten alle nicht jugendfreien oder ungeeigneten Bilder blockieren und in die entsprechenden Kategorien sortieren, können dies jedoch möglicherweise nicht alles von Hand tun.

Rufen Sie die Bilderkennungs-API auf. Mit der API können Sie zusammen mit einem geeigneten Bilderkennungsgerät jedes einzelne Bild scannen und anhand festgelegter Kriterien definieren. Sie können also die Bildbibliothek nach unanständigen Bildern durchsuchen und diese löschen. Sie können die Bilder scannen und diejenigen sortieren, die Lebensmittel in der Kategorie „Lebensmittel“ und Strickwaren in der Kategorie „Wolle“ enthalten. Sobald Sie der API mitteilen, was zu tun ist, wird der Prozess automatisiert.

Hier gibt es auch Möglichkeiten für Augmented Reality und interaktive Bilder und Videos. Sie können die Bilderkennung verwenden, damit ein Programm Objekte in der realen Welt erkennt. Sie könnten beispielsweise ein Foto von einem Paar Turnschuhen machen, die jemand auf der Straße trägt. Wenn das Programm die Turnschuhe erkennt, kann das Bild mit einem Link ergänzt werden, über den Sie sie selbst erwerben können. Dies kommt dem Unternehmen zugute (es bietet eine sofortige Verkaufschance) und dem Benutzer (er erhält das, was er gerade will).

Der Benutzer profitiert von der Bilderkennung

Das obige Sneaker-Beispiel ist nur eine offensichtliche Möglichkeit, wie Benutzer von der Bilderkennung profitieren können. Augmented Reality bedeutet, dass wir sofort auf Bewertungen, Preisinformationen und viele Daten zugreifen können, indem wir einfach ein Bild von einem Produkt machen. Das gibt den Benutzern riesige Datenmengen, die ihnen helfen, eine Kaufentscheidung zu treffen.

Mark Zuckerberg fasste in seiner Rede zu AI Anfang dieses Jahres einen oft übersehenen Nutzen für die Bilderkennung zusammen. Er stellte sich eine Bilderkennungs-API vor, die mit blinden oder sehbehinderten Menschen zusammenarbeitet, die ein Bild „lesen“ und beschreiben können, was es laut aussieht. Dies könnte massive Auswirkungen auf beeinträchtigte Internetnutzer haben - oder, mit Augmented Reality, irgendwann in der realen Welt.

Die Bilderkennung spielt auch eine Rolle bei der Fahrzeugsicherheit. Die neuen Technologien für autonomes Bremsen und Kollisionsvermeidung funktionieren ähnlich wie die APIs, über die wir gesprochen haben. Sie scannen und bewerten Bilder viele Male pro Sekunde, um Sie und Ihr Auto unterwegs zu schützen. Diese Technologie sagt autonomen Autos auch, was um sie herum ist.

Bilderkennungs-APIs werden unser Interneterlebnis nicht von alleine revolutionieren. Sie arbeiten mit der vorhandenen Technologie zusammen, um der Welt, die wir sehen, eine Ebene der Interaktion und des Eintauchens hinzuzufügen. Die Beispiele in diesem Artikel sind zwar begrenzt, es gibt jedoch ein großes Potenzial für Spiele, Filme, die Autoindustrie, den Einzelhandel, die Unterhaltungsbranche und jede technologiebasierte Branche. Dies ist nur der Anfang dessen, was intelligente Systeme leisten können!

Was sind Bilderkennungs-APIs und was können sie für Sie tun?