Naukowcy internetowego giganta – firmy Google, nie próżnująa. Właśnie pracują nad oprogramowaniem, które będzie widziało zdjęcia i je opisywało. Przeprowadzono już pierwsze testy, wyniki są obiecujące.
System opracowany przez Google jest złożony z dwóch sieci, których konstrukcja przypomina system nerwowy. Funkcją pierwszej jest rozpoznawanie tego, co zobaczy, natomiast drugiej słowny opis.
Pomysł na takie rozwiązanie zrodził się podczas prac na algorytmem, usprawniającym tłumaczenia automatyczne. Początkowo miało to jedynie polepszyć przełączanie między poszczególnymi językami, jednak zrodziła się idea, aby dane języka, który miał zostać przetłumaczony na inny, zastąpić obrazem. W praktyce wygląda to tak, że system analizy obrazu (CNN) odczytuje zawartość danego obrazu, analizuje go a następnie przekazuje sieci rekurencyjnej (RNN), która dokonuje tłumaczenia na zapis słowny.
| Zastosowanie tego typu oprogramowania może być bardzo różnorodne:
- pomoc dla osób niewidomych lub słabowidzących w rozumieniu tego, czego nie mogą zobaczyć
- odczyt obrazów z kamer przemysłowych i policyjnych
- ograniczenie wyświetlania transferożernych obrazów w urządzeniach mobilnych.
Wyniki testów, prowadzonych przez naukowców Google, dostępne tutaj.
Porozmawiajmy o Twoim pomyśle