ML For All: An Introduction to Nordstroms ML Platform

(Ariana Bray) (17. dubna 2020)

Naše strategie pro umožnění samoobslužného strojového učení ve velkém měřítku

Foto Pietro Jeng na Unsplash

Od správy logistiky dodavatelského řetězce po (vytváření kurátorských vzhledů (doporučení pro digitální styl) pro miliony zákazníků) využívá stále více týmů společnosti Nordstrom výkon strojového učení (ML) k dalšímu zlepšování zákaznické zkušenosti. Od výběru zdroje dat až po výběr programovacího jazyka to každý dělá jinak. Odkud přichází tým Nordstroms Machine Learning Platform? Představujeme Cerebro platformu strojového učení pro každého. V tomto článku probereme naši vizi pro Cerebro, potřebu platformy pro strojové učení a problémy, které jsme řešili při návrhu Cerebro.

Naše vize

Naše vize pro Cerebro bylo vytvořit platformu, která zmocní datové vědce, analytiky a další vývojáře ML k vytváření škálovatelných řešení ML, která budou mít přímý dopad na podnikání – jinými slovy, naším posláním je umožnit samoobslužné strojové učení ve velkém. Cerebro si klade za cíl poskytnout uživatelům jednotnou sadu nástrojů, které mohou použít k rychlému vývoji a sebevědomému nasazení svých řešení ML.

Stručně řečeno, hlavním účelem Cerebro je poskytnout snadný způsob, jak spravovat životní cyklus modelu. Cerebro přímo ovlivňuje celý Nordstrom nejen tím, že umožňuje rychlejší posunutí modelů do výroby, ale také tím, že umožňuje ostatním týmům používat Cerebro SDK k nahrazení jejich služeb našimi ML řešeními. Cerebro již používalo několik týmů v rámci Nordstromu k poskytování služeb svým projektům. Naše platforma byla použita k napájení interních nástrojů, jako je předpovídání modelů. V popředí našich rozhodnutí o designu ponecháváme následující pokyny:

Těchto cílů dosahujeme používáním automatizací k vytváření pohodlného uživatelského prostředí.

Automatizace pro pohodlný uživatelský komfort

Potřeba

Vědečtí pracovníci společnosti Nordstrom po dlouhou dobu hledali nové způsoby řešení tato otázka— jak povolit pracovní postup end-to-end strojového učení na produkční úrovni .

Pracovní postup musí také zahrnovat mnoho aspektů strojového učení.

Vložení datových inženýrů do každého týmu za účelem vytvoření jednorázových řešení pro tyto potřeby jednoduše není nákladově efektivní volba. Umožnit těmto týmům vědy o datech správu celého životního cyklu strojového učení (od příjmu dat po poskytování modelu) by zabralo nepřijatelné množství času, což by zpomalilo organizaci jako celek. Stručně řečeno, potřebovali jsme způsob abstraktního inženýrství ze strojového učení.

Příležitosti

Existuje široce známé problémy , které přicházejí s nasazením modelu do výroby. Kromě těchto problémů musí tým ML Platform řešit také problémy specifické pro Nordstrom:

  • Mnoho modelů, mnoho standardů : Společnost Nordstrom používá metriky a protokolovací řešení podnikové úrovně – ale bez efektivity kontaktů pro výsledky těchto metrik a protokolů jsou skutečně efektivní? Kdo je zodpovědný za udržování stavu služby a nástroje pro vyrovnávání zatížení? Jaké jsou některé metriky, které je třeba sledovat?
  • Scale : Případy použití datové vědy jsou omezeny na jedna samostatná výpočetní instance. Kvůli absenci podnikové platformy ML není distribuovaný výpočet využíván.
  • Workflow : Při absenci pracovních postupů ML musí technické týmy společnosti Nordstrom často provést významné úpravy projektu založeného na vědě o datech, aby byl připraven na produkci.
  • Učit se nové nástroje: Při absenci abstrakce mezi ML a strojírenstvím se lidé pracující na projektech ML musí naučit nové nástroje a technologie. Toto úsilí je časově náročné, vyžaduje technickou podporu a přidává zpoždění na časové ose vytváření modelu připraveného na produkci.

Proč nepoužívat pouze existující platformu?

Ve stávajících nabídkách ML SaaS existuje mnoho mezer:

  • Žádné centralizované úložiště funkcí
  • Žádná podpora pro všechny modely a jazyky
  • Softwarově specifické modely
  • Žádné sledování modelů; žádný kód → funkce → model linie
  • generování hyperparametru specifické pro daný rámec
  • Integrační výzvy se stávající infrastrukturou
  • Nákladné modely předplatného

Rozhodli jsme se vytvořit platformu, která datovým vědcům poskytne to, co potřebují a vyplní mnoho nedostatků, které zanechaly jiné řešení platformy ML.

Proč stavíme Cerebro

Cerebro je platforma, která demokratizuje strojové učení. Cerebro v jádru posiluje partnerství a překlenuje propast mezi datovou vědou a inženýrstvím.

Cerebro nabízí uživatelům řadu výhod, z nichž některé jsou zvýrazněny níže:

* Samoobslužný – spoléhání uživatele na samostatný technický tým je sníženo;

* Konzistentní – náš přístup je v souladu s existujícími pracovními postupy ML používanými komunitou datových věd;

* Méně nových technologií – potřeba uživatele naučit se nové technologie je omezena na absolutní minimum, protože prostřednictvím našich rozhraní poskytujeme abstrakci;

* Snadné použití – Cerebro nezpomaluje proces výroba modelů.

Spíše než najímat více techniků na podporu stále se rozšiřujících případů použití datové vědy , jsme vytvořili platformu , která může škálovat, aby tyto případy použití umožnila. Místo přijímání softwarově řízených rozhodnutí třetích stran chceme dělat vlastní rozhodnutí založená na algoritmech.

Výhody používání Cerebro

Pojďte tak, jak jste: Abstrakce pro standardizovaný pracovní postup

Náš tým nechtěl zaujmout normativní přístup a požádat každý tým, aby používal stejné nástroje a technologie. Místo toho jsme vyvinuli abstrakce, které pomáhají vytvářet standardizovaný pracovní postup – klid nad bouří. Uživatelé mají různé způsoby, jak vytvářet, vyvíjet a nasazovat své projekty.

Žádná proprietární technologie

Nezavádíme žádnou technologii, která je proprietární pro jakoukoli společnost nebo organizaci – proto nemáme žádné licenční náklady.

Žádné nové Potřebná výpočetní infrastruktura

Využíváme výpočetní platformy, které jsou již v Nordstromu zavedeny, a nevytváříme žádné nové.

Vyberte si vlastní Zdroj dat

Spíše než požádat každý tým o použití konkrétního zdroje dat, umožňuje Cerebro uživatelům bezpečné připojení k několika nejoblíbenějším databázím a datovým skladům. Jak platforma dospívá, povolíme připojení k ještě více datovým zdrojům.

Cloud Provider-Agnostic

I když má Cerebro určité závislosti na konkrétních poskytovatelích cloudu, stavíme se směrem k plně cloudové agnostické řešení, které lze snadno rozšířit tak, aby podporovalo více cloudových nabídek.

Nepodporují se žádná omezení na modelových tréninkových rámcích

Cerebro podporuje většinu populárních ML frameworků ihned po vybalení z krabice. Jakýkoli rámec, který by vědec v oblasti dat chtěl použít, může být podporován změnami minimálních až nulových změn.

Lineage Between Code, Data a Model

Díky cenným metadatům dostupným na každém kroku poskytuje Cerebro způsob, jak spojit kód zapsaná → použitá data → a vygenerovaná model . Uživatelé mohou získat informace o tom, jak je model obsluhován, a také povolit měření výkonu / efektivity modelu.

Testování a kontrola kvality

Cerebro usnadňuje bezproblémové testování logiky v rámci procesu kontinuální integrace. Kvalita dat se prosazuje na každém kroku.

One-Stop Shop

Cerebro to zvládne všechno. Uživatelé mohou:

  • vytvořit projekt strojového učení s vlastním úložištěm Gitlab
  • provádět místní vývoj
  • obsluhovat modely offline a online
  • organizovat projekt pomocí Kubernetes nebo Apache Spark na Kubernetes
  • spravovat kanály projektu pomocí podnikového softwaru s otevřeným zdrojovým kódem

Příběh dvou uživatelů

Pokud se uživatel o abstrakce nestará, nemusí je používat. Drtivá většina uživatelů však k dokončení svých projektů využívá naše abstrakce.

Vzhledem k tomu, že tým platformy Machine Learning Platform pokračuje v budování Cerebro, principy, kterých se držíme, slouží jako důležitá připomínka našeho konečného cíle.

Naše zásady

  • Modularita : Cerebro je mnohem víc než jen koncový bod, kterým datoví vědci předávají modely do – vyvinuli jsme SDK a máme několik ukázkových projektů, aby datoví vědci mohli vidět nejlepší případ použití pro své projekty. Díky prosazování osvědčených postupů v rámci naší sady SDK mohou naši uživatelé samostatně používat naši platformu s minimální pomocí týmu MLP a mít důvěru že nástroje, které používají v každé fázi životního cyklu modelu, jsou správné.
  • Otevřená komunikace : Nemá smysl nic stavět, pokud to nikdo nepoužívá – za tímto účelem má náš tým dvakrát týdně Office Hours, kde může kdokoli klesnout, aby vyřešil podrobnější otázky, které nelze vyřešit pomocí zpráv. Kromě toho tým pořádá dvoutýdenní schůzky s týmy pro datovou vědu, aby pochopil jejich potřeby a zabránil odchodu z kurzu. Protože přinášíme nové funkce každý druhý měsíc, je tato neustálá komunikace zásadní.
  • vysoká adopce : pracují na integraci naší sady SDK s široce používanými nástroji Nordstrom, jako je NordyPy , což umožňuje pohodlný uživatelský komfort. Jak se platforma vyvíjí, bariéra vstupu bude klesat stále níže. To umožňuje zákazníkům platformy pocházet z celé společnosti Nordstrom – nejen datová věda a inženýrství .

Co bude dál?

V budoucnu články, budeme diskutovat o budoucnosti Cerebro, nadcházejících funkcích a potenciálu open-source platformy.

Chtěli bychom poděkovat Nate Lee – dalšímu inženýrovi ML Platform, který pomohl napsat tento článek – stejně jako Rizky Ramdhani, Xingtai Li a Owais Malik, členové týmu ML Platform, kteří poskytli cennou zpětnou vazbu.

Napsat komentář

Vaše e-mailová adresa nebude zveřejněna. Vyžadované informace jsou označeny *