Jak używać wykrywania obrazów na platformach do webinarów

(Przemek Shemmy Majewski) (5 lipca 2020 r.)

Popularność platform do webinarów i oprogramowania do obsługi spotkań online wzrosła w ostatnich miesiącach, a wiele firm i instytucji edukacyjnych korzysta z internetu. Jeśli tworzysz platformę do webinarów (lub myślisz o niej), sztuczna inteligencja może się przydać z wykrywaniem obrazu, które może poprawić wrażenia użytkownika podczas transmisji na żywo. Przyjrzyjmy się, co możesz zrobić za pomocą wykrywania obrazów na platformie spotkań online.

W (bardzo małym) skrócie do wykrywania wystąpień używane jest wykrywanie obiektów obiektów semantycznych określonej klasy (takich jak ludzie, budynki lub samochody) w cyfrowych obrazach i filmach. Obecnie ma wiele aplikacji biznesowych, takich jak:

Ale jednym z zastosowań, które są teraz bardzo istotne, jest wykrywanie obiektów w czasie rzeczywistym w celu ulepszenia wideo na żywo na platformach webinarowych lub transmisji wideo na żywo. Coś, co wprowadziło wiele istniejących platform wideokonferencyjnych i mediów społecznościowych, szczególnie w ciągu ostatnich kilku miesięcy, przy zwiększonym zapotrzebowaniu użytkowników.

Ludzie częściej niż kiedykolwiek korzystają z webinarów i spotkań online

Z powodu pandemii COVID-19 wielu z nas utknęło w domu. Pracujesz i studiujesz zdalnie przez większość czasu i spotykasz się online, nie mogąc odwiedzić biura lub szkoły. Obecni dostawcy oprogramowania, którzy sprzedają platformy do webinarów i spotkań online, odnieśli na tym ogromne korzyści.

Według MarketWatch dzienna liczba aktywnych użytkowników Zoom w marcu Rok 2020 wzrósł o 378% w porównaniu z poprzednim rokiem, podczas gdy Microsoft zgłosił 775% ogólnego wzrostu wykorzystania jego aplikacji w chmurze (w tym aplikacji Teams) ze względu na gwałtowny wzrost liczby pracy zdalnej i nauki online. A Cisco Webex zorganizował 50 milionów spotkań tylko w marcu tego roku.

Ze względu na duże zapotrzebowanie i zwiększona konkurencja w przestrzeni, większość platform została zmuszona do zaostrzenia środków bezpieczeństwa i zwiększenia wydajności. Ale zaczęli też szukać innych sposobów na zwiększenie komfortu użytkowania i przyciągnięcie większej liczby użytkowników, słusznie wyczuwając w tym momencie okazję.

Jednym ze sposobów, w jaki mogli to zrobić, było skupienie się na rozwijaniu wykrywania obrazów algorytmy wprowadzające nowe, pomocne i często zabawne funkcje.

Na szczęście dzięki niedawnym postępom w głębokim uczeniu się, modelach widzenia komputerowego i przetwarzaniu obrazu, aplikacje korzystające z wykrywania obiektów w czasie rzeczywistym stały się znacznie łatwiejsze do zbudowania i rozwijaj się w dzisiejszych czasach, a jednocześnie znacznie wydajniej.

Sposoby wykorzystania wykrywania obiektów w czasie rzeczywistym w wideo na żywo

Wyzwanie dla oprogramowania do obsługi wideokonferencji, seminariów internetowych, lub transmisje na żywo wykrywają i klasyfikują obiekty w czasie rzeczywistym – przy jednoczesnym zachowaniu wysokiej wydajności, co ma kluczowe znaczenie dla produktywności i wydajności spotkań online.

Obecnie oprogramowanie może wykryć osobę w kadrze i sklasyfikować obiekty na osobę na pierwszym planie i objec ts w tle. Umożliwia to tworzenie przydatnych funkcji dla platform wideokonferencyjnych, ale także aplikacji do gier lub mediów społecznościowych.

Zastąpienie tła wybranym obrazem, wideo lub GIF-em

To wszystko stało się wściekają się ostatnio, gdy więcej zespołów na całym świecie zaczęło pracować zdalnie i potrzebowało sposobu, aby niezliczone spotkania online były bardziej zabawne.

Ale co ważniejsze, daje to również markom szansę na wykorzystanie ich logo lub markowych obrazów i filmów w tle. Pomaga to zwiększyć rozpoznawalność marki podczas np. demo produktu i wywrzeć lepsze wrażenie na widzach.

Uczestnicy spotkania mogą wybrać dostępne tło zdjęcia lub wybrać jedno z folderu na pulpicie lub z rolki aparatu w telefonie. Oprogramowanie wykrywa twarz, starannie umieszczając ją na tle, najlepiej bez zbytniego wpływu na ogólną wydajność spotkania.

Oto jak może wyglądać usunięcie tła w celu zastąpienia go markowym obrazem lub wideo:

Rozmywanie tła

Pomaga to skupić obraz tylko na osobie w pierwszy plan. To znowu bardzo popularna funkcja wprowadzona niedawno, np. Przez Skype, pozwalająca ludziom czuć się bardziej komfortowo podczas rozmów biznesowych z wideo, nie zwracając uwagi na to, co (lub kto) za nimi stoi.

W ten sposób użytkownicy mogą zachować profesjonalizm i nie martwić się o swoje otoczenie, zwłaszcza gdy nie mogą pracować w uporządkowanym biurze.

(Każdy, kto w dzisiejszych czasach kiedykolwiek rozmawiał przez Internet z dziećmi lub współmałżonkiem / partnerem w domu albo stosami prania w tle, z pewnością to doceni).

również użyteczna funkcja używana w grach , aby zanurzyć głośnik / gracza w świecie gier komputerowych podczas gry na żywo.

Jak zbudować własny system rozpoznawania obrazów

Niedawno opublikowaliśmy ebook, który dokładnie pokazuje, co jest potrzebne do zbudowania najnowocześniejszego oprogramowania wykorzystującego algorytmy rozpoznawania obiektów. Pobierz go stąd i dowiedz się, krok po kroku, jak:

  • Zdefiniować zakres projektu i metryki
  • Zbieraj dane i używaj danych syntetycznych
  • Trenuj modele i testuj ich wydajność
  • Wdrażaj modele do produkcji
  • Monitoruj i optymalizuj ich wydajność w czasie

A jeśli szukasz porady eksperta na temat używania wykrywania obiektów w swoim oprogramowaniu – porozmawiaj już dziś ze specjalistą DLabs AI .

Pierwotnie opublikowane pod adresem https://dlabs.ai 5 lipca 2020 r.

Dodaj komentarz

Twój adres email nie zostanie opublikowany. Pola, których wypełnienie jest wymagane, są oznaczone symbolem *