Anonim

Vad är API: er för bildigenkänning, och vad kan de göra för dig? Den här artikeln kommer att klargöra vad bildigenkänning är, vad ett API gör och hur det kan hjälpa dig eller ditt företag att få ut mer av internet. Bildigenkänning har enorm potential för företag och för enskilda synskadade internetanvändare.

Vad är ett API för bildigenkänning?

Bildigenkänning är där en mjukvara upptäcker en bilds egenskaper och kategoriserar den exakt. Om du till exempel laddar upp en bild av en Ferrari 458 till en API för bildigenkänning bör den inse att den är en bil och att den är (eller borde vara) röd. Beroende på API kan ytterligare klassificering vara möjlig beroende på vilken typ av bild du använder.

Detta kan verka riktigt enkelt - människor kan titta på en bild och berätta vad det är en bild av utan att försöka, för det mesta - men det har varit ett svårt problem att lära datorer att lösa. Mycket arbete har gått igenom hur en dator kan förstå hur saker ser ut, och vi har gjort stora framsteg, från förmågan att göra omvända bildsökningar till Googles berömda Deep Dream-nätverk.

Ett API är ett applikationsprogramgränssnitt. Det är i huvudsak en mellanhand mellan programrutiner som berättar ett element hur man arbetar med en annan, eller tillhandahåller de verktyg de behöver för att utföra en funktion. Det finns dussintals typer av API som kan uppnå alla möjliga mål med hjälp av ett antal programmeringsspråk. I detta sammanhang är ett API för bildigenkänning verktyget du kan använda för att komma åt den djupa inlärningskraften i vissa kommersiella bildigenkänningssystem.

Du behöver mycket datorkraft för att utföra bildigenkänning. Du behöver massor av data och kraften att tolka allt. De flesta användare har helt enkelt inte de enorma resurserna för att bygga sin egen djupa inlärningsmaskin. Stora namn som Googles Vision API, Microsofts Face API, ImageNet och andra har sådana maskiner och ger åtkomst till dem genom API: er, antingen gratis eller mot en avgift. Detta gör att företag i alla storlekar får åtkomst till denna kraft och användare får nya upplevelser som resultat.

Hur kommer bildigenkänning att förändra vår internetupplevelse?

Olika internetanvändare kommer att få olika fördelar med bildigenkänning. Låt oss titta på en hypotetisk webbplatsägare och en hypotetisk användare för att se hur båda sidor kan dra nytta.

Affärsfördelarna med bildigenkänning

Låt oss som ett exempel säga att du driver en egenförsäljningsportal som liknar Etsy eller en datingsida. Du vill hantera kvaliteten och lämpligheten för alla bilder som laddats upp av användare. Du vill blockera alla vuxna eller olämpliga bilder och sortera dem i lämpliga kategorier, men du kan omöjligt göra allt för hand.

Ange API för bildigenkänning. Du kan använda API: et, tillsammans med en lämplig bildigenkänningsmaskin, för att skanna varje enskild bild och definiera den med angivna kriterier. Så du kan skanna biblioteket med bilder efter obehagliga bilder och ta bort dem. Du kan skanna bilderna och sortera bilder som innehåller mat i kategorin ”mat” och stickat i kategorin ”ull”. När du berättar API: t vad du ska göra automatiseras processen.

Här finns också möjligheter för förstärkt verklighet och interaktiv bild och video. Du kan använda bildigenkänning för att få ett program att känna igen objekt i den verkliga världen. Till exempel kan du ta en bild av ett par sneakers som någon bär på gatan. Om programmet känner igen sneakersna, kan bilden förstärkas med en länk för att köpa dem själv. Detta gynnar företaget (det ger en omedelbar försäljningsmöjlighet) och gynnar användaren (de får vad de vill ha just nu).

Användaren har fördelar med bildigenkänning

Sneakerexemplet ovan är bara ett uppenbart sätt som användare kan dra nytta av bildigenkänning. Utökad verklighet innebär att vi direkt kan komma åt recensioner, prisinformation och massor av data helt enkelt genom att ta en bild av en produkt. Det ger användarna enorma mängder data för att hjälpa dem att fatta ett köpbeslut.

Mark Zuckerberg sammanfattade en ofta förbisett fördel för bildigenkänning i sitt anförande om AI tidigare i år. Han föreställde sig ett bildigenkännings-API som fungerade med blinda eller synskadade personer som kunde "läsa" en bild och beskriva vad den ser högt. Detta kan ha enorma återverkningar för nedsatta internetanvändare - eller, med den förstärkta verkligheten, ute i den verkliga världen någon gång i raden.

Bildigenkänning spelar också en roll i fordonssäkerhet. De nya autonoma broms- och kollisionsundvikelseteknologierna som introduceras fungerar på samma sätt som API: erna vi har pratat om. De skannar och utvärderar bilder många gånger i sekundet för att hålla dig och din bil säker när du är på väg. Denna teknik som också berättar för autonoma bilar.

API: er för bildigenkänning kommer inte att revolutionera vår internetupplevelse på egen hand. De arbetar tillsammans med befintlig teknik för att lägga till ett lager av interaktion och nedsänkning till den värld vi ser. Medan exemplen på denna artikel är begränsade finns det en enorm potential för spel, filmer, bilindustrin, detaljhandel, underhållning och all teknikaktiverad industri. Detta är bara början på vad intelligenta system kan uppnå!

Vad är apis för bildigenkänning, och vad kan de göra för dig?