GAMMA FACET: Uusi lähestymistapa yleisiin selityksiin Koneoppimismallit

(Konstantin Hemker)

Kirjailijat: Jan Ittner, Konstantin Hemker & Malo Grisard

Tekoälyn (AI) teknologian nopea kehitys antaa meille aina kehittyvä työkalusarja analysoida jopa monimutkaisimmat reaalimaailman liiketoiminnan ongelmat ja prosessit. Huipputason koneoppimisalgoritmien avulla päättäjät voivat ennustaa tarkasti liiketoiminnan kannalta kriittiset tulokset, kuten kustannukset, nopeuden, laadun tai tuoton. Mutta usein tekoälyn todellinen liiketoiminta-arvo ei ole pelkästään ennustaa tuloksia (mitkä asiakkaat todennäköisesti purkavat sopimuksen?), Vaan selittää ja näiden tulosten optimointi (mitä meidän on tehtävä säilyttääksemme arvokkaita asiakkaita?).

Lisäksi esimiehen halu hyväksyä koneoppimisen käyttö päivittäisten päätösten tekemiseksi riippuu hänen luottamuksestaan ​​algoritmiin, mikä puolestaan ​​vaatii jonkin verran ymmärrystä siitä, kuinka tekoälymalli tekee ennusteita ja päätöksiä. Tarve selittää tekoälymalleja tulee entistä tärkeämmäksi, kun yritykset kehittävät tietoisuutta eettisestä tekoälystä ja pyrkivät suunnittelemaan tekoälymalleja, jotka kykenevät puolueettomaan, turvalliseen ja vastuulliseen päätöksentekoon.

Yhteistyöpeliteorian käyttäminen ominaisuuksien selittämiseen

Ihmisille selitettävissä oleva tekoäly on viime vuosina osoittanut valtavia edistysaskeleita, etenkin kun on tullut Shapley Additive Explanations (SHAP), joka on yhdistävä teoria ja algoritmi, joka soveltaa osuuskuntapeliteoriaa selittää koneoppimismallin yksittäiset ennusteet. SHAP: n tekee niin houkuttelevaksi, että huolimatta edistyneestä matemaattisesta taustastaan, tulokset ovat intuitiivisia jopa yleisölle.

SHAP määrittelee mallin kaikkien muuttujien panoksen mihinkään ennustettuun tulokseen. Voimme esimerkiksi käyttää mallia ennustaa potilaan riski sairastua diabetekseen muuttujien, kuten paino, ikä ja liikuntatavat, perusteella. Malli saattaa kertoa meille, että riski on 67%. SHAP menee pidemmälle ja kertoo meille esimerkiksi, että potilaan ikä lisää diabeteksen riskiä 5%, kun taas hänen paino laskee sitä 2%.

Mallitarkastusten ja virtuaalikokeiden selventävä rooli

SHAP tarjoaa erittäin hyödyllisen tavan selittää yksittäisiä ennusteita. Viime aikoihin saakka oli kuitenkin vain rajalliset keinot selittää malli kokonaisuutena – selittää yleisesti, kuinka muuttujat toimivat ja ovat vuorovaikutuksessa ennusteiden keksimiseksi. GAMMA FACET esittelee uuden, kokonaisvaltaisen lähestymistavan koneoppimismallien selittämiseen. Se tekee sen kahdesta näkökulmasta: Ensinnäkin se käyttää äskettäin kehitettyä mallintarkastus -algoritmia selittääkseen, kuinka ennustavan mallin muuttujat tekevät yhteistyötä ennustamaan tuloksia tunnistamalla kuvioita monien yksittäisten ennusteiden selityksissä. Esimerkiksi GAMMA FACET saattaa havaita, että paino ja ruumiin massa on otettava huomioon yhdessä arvioitaessa diabeteksen riskiä, ​​kun taas ruumiin massaindeksi ja pituus / vyötärö-suhde voivat olla vaihdettavissa. Toiseksi, se käyttää simulointimenetelmää määrittääkseen ”virtuaalikokeissa”, miten systemaattiset muutokset keskeisiin tekijöihin vaikuttavat ennustettuihin tuloksiin, kuten miten iän kasvu vaikuttaa diabeteksen riskiin potilasjoukossa.

Tapaustutkimus: Vesiporauksen hajoamisen estäminen

Paras tapa tutkia näitä käsitteitä on reaalimaailman esimerkki . Vesikaivon poraus on erittäin vaarallista ja kallista. Tällaisen porauksen kustannukset riippuvat ajasta, joka kuluu kaivon viimeistelyyn veden pumppaamisen aloittamiseksi siitä. Näiden kustannusten vähentämiseksi poraajia kannustetaan yleensä poraamaan nopeammin – mitattuna Tunkeutumisaste (ROP). Maaperän ominaisuuksista riippuen päivähinnat voivat vaihdella 30–2 000 dollarista. Mutta on kompromissi: nopeampi poraus lisää vaaratilanteiden, kuten muodostumien romahtamisen tai kaasun tunkeutumisen, riskiä. Siksi rakennamme koneoppimisen mallin ymmärtämään porausnopeuden vaikutusta tapahtumariskiin muiden riskitekijöiden yhteydessä.

Selkeyden vuoksi käytämme yksinkertaistettua tietoaineistoa tässä esimerkissä. . Aineisto sisältää 500 havaintoa, joista jokainen rivi edustaa menneisyyden porausoperaatiota, sekä binaarinen indikaattori siitä, tapahtuiko toiminnassa kaivonporaus.

Nykyisten ja aikaisempien käyttöolosuhteiden perusteella ennakoivaa algoritmia voidaan käyttää varoittamaan porausoperaattoria korkea vaaratilanne. Operaattoreilla olisi silloin mahdollisuus säätää porausparametreja. Tietäminen milloin toimia ei kuitenkaan usein riitä.Kuljettajan on myös ymmärrettävä miksi on tapahtumia, ja jotka ovat optimaaliset porausolosuhteet, jotka tasapainottavat porauskustannukset mahdollisen tapahtuman kustannuksiin. GAMMA FACET voi auttaa toimittamaan nämä käytännölliset oivallukset.

scikit-learn ja Model Pipeline

Jotta voisimme muodostaa selitettävän koneoppimismallimme selkärangan, meidän on ensin rakennettava malliputki, jonka avulla voimme jäljittää kaikki mallin lähdöt takaisin alkuperäisiin tietopanoksiin kaikissa muunnos- ja koulutusvaiheissa.

GAMMA FACET on suunniteltu Scikit-Learn-palvelun, de facto -teollisuuden standardin mukaan koneoppimiseen Pythonissa. scikit-learn tarjoaa laajan valikoiman regressio- ja luokittelualgoritmeja. Se tarjoaa myös universaalin lähestymistavan koneoppimisputkien rakentamiseen yhdistämällä tietojen esikäsittely ja todellinen mallin sovittaminen yhteen integroituun työnkulkuun.

FACET parantaa scikit-learn ia kolmella olennaisella tavalla :

  1. Päästä toiseen -ominaisuuden jäljitettävyys : Vaikka natiivi scikit-learn on rakennettu noin numpy ja tuottaa kaikki lähdöt numeerisina matriiseina, FACET tarjoaa parannetut versiot yli 150 scikit-learn-muuntajasta, regressorista ja luokittelijasta, jotka toimittavat kaikki lähdöt pandojen datakehyksinä. Lisäksi FACET sisältää määritteitä johdettujen ominaisuuksien nimien kartoittamiseksi takaisin ominaisuuksiin, joista ne ovat peräisin. Tämä kartoitus on välttämätöntä, jos ominaisuuksiin viitataan nimellä koneen oppimisputkessa myöhemmin.
  2. Parannettu putkilinjaus : FACET esittelee kaksivaiheisia putkiluokkia, jotka sisältävät yhden esikäsittelyvaiheen (joka itse voi olla putki) ja oppijan vaiheen. Kokemuksemme on, että tämä näennäisesti pieni lisäys johtaa huomattavasti tiiviimpään ja luettavampaan putkistokoodiin.
  3. Parannettu tarkistus : FACET esittelee ristivalidaaattoreita useille bootstrapping-muunnelmille, tilastolliselle tekniikalle, joka on erityisen tärkeä FACET-simulointimahdollisuuksien yhteydessä.

Palaten takaisin porausesimerkkiin, tässä saattaa rakentaa putkilinjan FACET: n tuella ominaisuuksien jäljitettävyydelle:

Kuten näette tässä koodinpätkässä, yllä oleva putki näyttää melkein samalta kuin puhdas, joka on rakennettu puhtaalla scikit-learn . Huomaa kuitenkin, että tuomme kaikki putket, muuntajat ja estimaattorit FACET-paketista sklearndf ja että kaikkien tuttujen scikit-learn -luokkien nimillä on ”DF” -liite. Huomaa myös erityinen ClassifierPipelineDF, yksi FACETin parannetuista putkista, joka käsittää yhden valinnaisen esikäsittelyvaiheen, sekä seuraava oppijan vaihe, joka taataan luokittelijaksi. Kuten tulosteesta näkyy, esikäsittelyn tulos on datakehys, joka säilyttää kaikki ominaisuuksien nimet.

Seuraavaksi haluamme virittää mallimme hyperparametrit FACET: n . LeanerRanker toimii samalla tavalla kuin scikit-learn ruudukonetsijä, mutta tekee paljon helpommaksi antaa monen tyyppisten mallien kilpailla keskenään sen sijaan, että optimoisi hyper- yksittäisen mallin parametrit:

Mallin selitykset: Mikä aiheuttaa tapahtumia?

Meillä on nyt viritetty ja koulutettu malli, joka ennustaa porausoperaatioidemme vaaratilanteen. Mutta haluamme olla ennakoivampia kuin vain käyttää mallia ja reagoida tapauskohtaisesti ennustettuihin riskeihin. Sen sijaan haluamme tietää, mitä malli on oppinut siitä, miksi ja milloin tapahtuu. Haluamme mallin auttavan meitä ymmärtämään, kuinka voimme järjestelmällisesti muuttaa porakoneidemme käyttötapaa tapahtumariskin vähentämiseksi.

FACET lähestyy mallin selitystä kahden menetelmän yhdistelmänä:

  1. Globaalien ominaisuuksien vuorovaikutusten selittäminen : Tämä menetelmä kertoo meille, mitä malli on oppinut siitä, miten ominaisuudet vaikuttavat sekä yksittäin että yhdessä tuloksiin. FACET esittelee uuden algoritmin, joka kvantifioi jokaiselle ominaisuusparille synergian, redundanssin ja riippumattomuuden (katso lisätietoja alla). Tämä algoritmi perustuu SHAP-vektorin hajoamiseen , matemaattiseen kehykseen, jonka olemme kehittäneet globaalimallien selityksiin ja josta kerromme tarkemmin tulevassa julkaisussa.
  2. Mallipohjaiset simulaatiot : Tämän menetelmän avulla voimme tunnistaa, kuinka systemaattiset ominaisuusmuutokset auttavat saavuttamaan toivottu lopputulos, tässä tapauksessa porausvikojen riskin minimoimiseksi. Saavutamme tämän tuloksen luomalla synteettisiä näytteitä useille arvoalueille ja käyttämällä mallia arvioidaksesi ennustetun riskin muutoksia. Kuten alla näet, globaalien ominaisuuksien vuorovaikutusten (eli menetelmän 1) ymmärtäminen on tärkeä askel sen varmistamiseksi, että simulaatiomme ovat kelvollisia todellisissa olosuhteissa.

Kun sitä käytetään porausesimerkissämme , FACETin LearnerInspector -luokka tarjoaa yleiskuvan ominaisuuksien vuorovaikutuksesta laskemalla pareittain synergia ja redundanssi :

Redundanssi ja synergia matriisi

Tulokset ovat kaksi matriisia, jotka ilmoittavat meille minkä tahansa ominaisuusparin osalta prosentteina synergian ja redundanssi näiden kahden ominaisuuden välillä.

Synergia

Synergia on aste, jossa malli yhdistää yhden ominaisuuden tiedot toisen ennustamaan kohteen. Oletetaan esimerkiksi, että ennustamme sydän- ja verisuoniterveyttä iän ja sukupuolen perusteella, ja sopiva malli sisältää monimutkaisen vuorovaikutuksen niiden välillä. Tämä tarkoittaa, että nämä kaksi ominaisuutta ovat synergistisiä sydän- ja verisuoniterveyden ennustamisessa. Molemmat ominaisuudet ovat lisäksi tärkeitä mallille, ja kumman tahansa poistaminen vaikuttaisi merkittävästi suorituskykyyn. Oletetaan, että ikä on tärkeämpi piirre kuin sukupuoli, joten ikä vaikuttaa enemmän yhdistettyyn ennustamiseen kuin sukupuoli. Tämä epäsymmetrinen vaikutus tarkoittaa sitä, että synergia (ikä, sukupuoli) on pienempi kuin (sukupuoli, ikä). Voit ajatella sitä toisella tavalla kuvittelemalla, että ennuste on koordinaatti, johon yrität päästä. Alusta alkaen ikä vie sinut paljon lähemmäksi tätä pistettä kuin sukupuoli, mutta sinä tarvitset molemmat päästäksesi sinne. Synergia heijastaa sitä, että sukupuoli saa enemmän apua iästä (suurempi synergia sukupuolen näkökulmasta) kuin ikä sukupuolesta (alempi synergia iän näkökulmasta) ennusteen saavuttamiseksi.

Tämä johtaa tärkeä kohta: synergia on luonnollisesti epäsymmetrinen ominaisuus globaalille tiedolle, ja kaksi vuorovaikutuksessa olevaa ominaisuutta vaikuttavat mallien ennusteisiin. Synergia ilmaistaan ​​prosentteina, jotka vaihtelevat välillä 0% (täydellinen autonomia) 100%: iin (täydellinen synergia). Huomaa, että synergistiset ominaisuudet voivat olla täysin korreloimattomia, ja niitä voi olla vaikea havaita säännöllisen tutkivan analyysin avulla.

Synergiamatriisin tulkitsemiseksi parin ensimmäinen ominaisuus on rivi (”Perspektiivi”), ja toinen sisältää sarakkeen. Porausesimerkissä FACET raportoi, että pyörimisnopeuden ”näkökulmasta” 67% tiedoista yhdistetään bitin painoon ennustamaan vika. Tämä tuntuu järkevältä asiayhteydessä, koska porauksella, jolla on sekä suuri bittipaino että suuri kierto, voi olla suhteettoman suuri vaikutus laitteen kulumiseen ja lisätä näin huomattavasti tapaturmariskiä. On ymmärrettävää, että synergia on korkea myös bitin painon kannalta (61%). Tämä kertoo meille, että meidän tulisi tarkastella pyörimisnopeutta ja painoa yhdessä, jotta ymmärrämme niiden vaikutuksen tapahtumariskiin.

Redundanssi

Redundanssi on aste, jolla mallin ominaisuus kopioi toisen ominaisuuden tiedot kohteen ennustamiseksi. Oletetaan esimerkiksi, että meillä oli talon koko ja makuuhuoneiden määrä talon hinnan ennustamiseksi. Nämä ominaisuudet keräävät samanlaista tietoa kuin mitä enemmän makuuhuoneita, sitä suurempi talo ja todennäköisesti keskimäärin korkeampi hinta. (Makuuhuoneiden lukumäärä, talon koko) irtisanominen on suurempi kuin (talon koko, makuuhuoneiden lukumäärä). Tämä johtuu siitä, että talon koko ”tietää” enemmän makuuhuoneiden lukumäärästä ennustaa talon hintaa kuin päinvastoin. Siksi on suurempi irtisanominen makuuhuoneiden lukumäärän näkökulmasta. Toinen tapa ajatella sitä on talon koon poistaminen, mikä on haitallisempaa mallin suorituskyvylle kuin makuuhuoneiden lukumäärän poistaminen, koska talon koko voi paremmin kompensoida makuuhuoneiden puuttumisen. Tämä tarkoittaa myös sitä, että talon koko olisi mallissa tärkeämpi ominaisuus kuin makuuhuoneiden lukumäärä.

Tärkeää tässä on se, että synergian tavoin redundanssi on luonnollisesti epäsymmetrinen ominaisuus globaalissa informaatio-ominaisuudessa. parien on ennustettava tulos. Redundanssi ilmaistaan ​​prosentteina, jotka vaihtelevat välillä 0% (täydellinen ainutlaatuisuus) 100%: iin (täydellinen redundanssi). Redundanssia ei välttämättä voida havaita etsivässä analyysissä, jos kaksi ominaisuutta on tarpeeton, mutta eivät ole lineaarisesti korreloivia.

Kuten synergiassa, matriisirivi on ”perspektiivi” -ominaisuus rivi-sarake-ominaisuusparissa.Porausesimerkissämme havaitsemme kaksi paria erittäin redundantteja ominaisuuksia:

  • Ensimmäinen redundantti ominaisuuspari on ROP ja IROP. Redundanssi on samanlainen kummankin ominaisuuden näkökulmasta (75%), koska toinen on toisen käänteinen ja siten he voivat korvata mallissa toistensa vaaratilanteen riskin. Tämä on hyvä esimerkki FACET: n kyvystä kerätä redundansseja ominaisuuksien välillä, vaikka ne eivät olekaan lineaarisesti korreloivia.
  • Toinen redundanttien ominaisuuksien pari on toiminnan syvyys ja reiän halkaisija. Reiän halkaisijan näkökulmasta 53% tiedoista kopioidaan toiminnan syvyyden kanssa vian ennustamiseksi. Intuitiivisesti voimme nähdä miksi, koska toiminnan syvyys ja reiän halkaisija ovat hyvin yhteydessä toisiinsa, kun poraajat käyttävät ohuempia poranterää poratessaan syvemmälle maahan. (Toimenpiteen syvyys, reiän halkaisija) redundanssi on hieman pienempi kuin (reiän halkaisija, toiminnan syvyys), koska toiminnan syvyys on mallissa hieman tärkeämpi ominaisuus.

FACET voi tuottaa toisen tyyppisen kaavion, joka on erittäin hyödyllinen arvioitaessa synergiaa tai redundanssisuhteita hierarkkisena klusteroituna dendrogrammana. Huomaa, että tämä lähestymistapa perustuu redundanssin (tai synergian) symmetriseen muunnokseen, joka tarjoaa paitsi yksinkertaistetun perspektiivin myös ominaisuusetäisyyden (1 – metrinen) klustereille. Esimerkissämme olemme kiinnostuneita redundanssidendrogrammista:

Facetin ominaisuuden redundanssidendrogrammi

Redundanssidendrogrammi paljastaa ylimääräisten ominaisuuksien klusterit, osoittaa klusterin ominaisuuksien keskinäisen redundanssin aste (muut vasemmanpuoleiset piirteet yhdistetään dendrogrammiin, sitä voimakkaampi niiden redundanssi on) ja osoittaa väriskaalaa käyttämällä ominaisuuksien merkityksen yksittäisille ominaisuuksille ja ominaisuuksien ryhmille.

Kaksi redundanttisten ominaisuuksien paria on selvästi tunnistettavissa dendrogrammasta, mukaan lukien niiden yhdistetty merkitys. Tunkeutumisnopeus (ROP) on erittäin turha käänteisen ominaisuutensa (IROP) (yli 80% redundanssi) kanssa, ja molempien ominaisuuksien yhteinen merkitys on 36%. Ottaen huomioon, että haluamme simuloida ROP: tä, poistamme IROP: n varmistaaksemme, että simuloimamme ominaisuus on ainutlaatuinen tekijä lopputuloksessa (annamme tarkemman selityksen seuraavassa osassa).

Siellä on mielenkiintoinen havainto, kun luodaan uusi redundanssidendrogrammi IROP: n poistamisen ja mallin uudelleenkoulutuksen jälkeen: ROP: n ominaisuus on noussut jopa 35%, mikä osoittaa, että ROP on ottanut entisen ROP / IROP-klusterin roolin selittämään ROP: ta liittyvä vaikutus tapahtumariskiin.

Redundanssisidosdendrogrammi ominaisuuksien karsimisen jälkeen div id = ”038200d258″>

Ominaisuuden nousun simulointi

Tarkastettu mallin avulla olemme päässeet hyvin ymmärtämään, kuinka malli tekee ennusteen ja kuinka ennustajat ovat vuorovaikutuksessa keskenään.

Nämä oivallukset johtavat usein suoraan ”mitä jos” -kysymykseen: H Kuinka voimme muuttaa järjestelmällisesti vaikuttavaa muuttujaa tuloksen parantamiseksi? Esimerkissämme haluamme ymmärtää, kuinka tunkeutumisnopeuden muutokset vaikuttavat tapahtumariskiin. Taloudellisesta näkökulmasta porausyritykset yrittävät porata mahdollisimman nopeasti säilyttäen samalla turvallisuuden ja vähentäen vikoja. Samanlaisia ​​kysymyksiä sovelletaan muihin liiketoimintaympäristöihin, joissa tavoitteena on vähentää kustannuksia, maksimoida tuotto, säilyttää asiakkaat tai todellakin optimoida liiketoiminnan lopputulos tietojen perusteella. sarja ”virtuaalikokeita” arvoluokalle, teeskentelemällä jokaiselle kokeelle, että simuloitu ominaisuus otti aina jokaiselle historialliselle havainnolle annetun arvon.

Tällä lähestymistavalla on ratkaisevan tärkeää, että simuloimamme ominaisuus on ei ole tarpeeton mallin muiden ominaisuuksien kanssa. Se tekisi vaaran luoda mahdottomia skenaarioita säätämällä yhden ominaisuuden arvoa, mutta ei sen turhaa sisarusta. Jos simuloimme esimerkissämme ROP: ää useille arvoalueille, mutta pidämme IROP: n mallissa, luomme todennäköisesti todennäköisiä skenaarioita.

Simulaatio suoritetaan kahdessa vaiheessa: Ensinnäkin, päätämme simuloitavasta ominaisuudesta ja valitsemme yhden FACETin osioija luokista jakamaan kyseisen ominaisuuden aiemmin havaittujen arvojen alue osioiksi . Toiseksi suoritamme yhden simulaation kutakin osiota kohden, kiinnitämme joka kerta simuloidun ominaisuuden arvon osion keskiarvoon kaikissa havainnoissa.

Siksi simulaatio esittää esimerkissämme kysymyksen: ”Mitä Keskimääräinen tapaturmariski on ollut, olenko aina porannut X m / s ROP: lla?”ROP mitataan reaalilukuna, joten käytämme ContinuousRangePartitioner -sarjaa luomaan sarja yhtä suurikokoisia osioita ROP: lle historiallisesti havaittujen arvojen alueelle. On tärkeää, että simuloimme vain historiallisesti havaituilla arvoalueilla, koska malli on koulutettu kyseisen alueen arvoihin, eikä se yleensä pysty esittämään kelvollisia ekstrapolaatioita alueen ulkopuolella.

Simulointivaihe 1 – ROP-ominaisuuden havaittujen arvojen jakaminen samankokoisiin ämpäreihin

Käyttäminen paras malli, jonka olemme aiemmin tunnistaneet LearnerRanker -sivulta, simulaattori määrittää nyt kunkin osion keskimääräisen ennustetun tapahtumariskin. FACET tukee käynnistystä, jolloin voimme toistaa jokaisen simulaation useita kertoja mallin muunnelmille, jotka on koulutettu erilaisille tietojoukoille, ja käyttää simulointitulosten jakautumista kvantifioimaan simulaation luottamustaso.

Simulointivaihe 2 – ROP-ominaisuuden eri arvojen tulosten simulointi

Yllä oleva visualisointi osoittaa ROP: n vaikutuksen tapahtumariskiin, samalla kun se antaa luottamuksen tunteen simulaatiossa. X-akseli näyttää eri osiot, joille simulaatio suoritettiin. X-akselin alapuolella olevat palkit osoittavat osiossa olevien alkuperäisessä näytteessä olevien havaintojen lukumäärän osoittamalla tuen, joka meillä on jokaiselle simuloidulle arvolle. (Huomaa, kuinka luottamusväli laajenee kohti marginaaleja, kun näemme vähemmän todellisia havaittuja arvoja näille osioille.) Keskimmäinen nouseva viiva edustaa ennustettua mediaaniriskiä kullekin osiolle, kun taas ulkolinjat osoittavat kaikkien ristien 95%: n luottamusvälin. vahvistus eroaa ennustuksestamme.

Simulaatio vahvistaa, että tapahtuman todennäköisyys kasvaa merkittävästi, kun ROP kasvaa. Se tarjoaa käsityksen nopeamman ROP-toiminnan riskitasoista. Voimme myös nähdä, että on ollut useita kertoja, joissa ROP: ta käytettiin vaarallisen korkealla tasolla (> 30 jalkaa / h), mikä johti yli 70 prosentin tapahtumien todennäköisyyteen.

Mitä seuraavaksi?

Liiketoiminnan näkökulmasta vastausten saaminen näihin ”mitä jos” kysymyksiin on erittäin arvokasta riskien arviointiprosessille ja löytää tapoja parantaa nykyisiä prosesseja. Esimerkissämme matka ei päättyisi tähän. Simulaation tulosten perusteella seuraava askel voisi olla kustannushyötyanalyysin suorittaminen poratessa hitaammin tai nopeammin ROP: lla, jotta saavutettaisiin paras kompromissi porauskustannusten ja poraustapahtuman taloudellisen riskin välillä.

Voit helposti ottaa GAMMA FACETin pyöräytykseen. Yksinkertaisesti conda install gamma-facet -c bcg_gamma -c conda-forge ja tutustu GitHub-arkistoon , niin saat lisätietoja ja toimivat esimerkit.

Kiitokset

Tämä paketti ei ole ollut mahdollista ilman kahden erinomaisen Python-paketin saatavuutta koneoppimiseen ja mallien selitettävyyteen:

1. scikit-learn tarjoaa oppijoille ja muuntajille, jotka muodostavat FACETin taustalla olevat koneoppimisputket. Lisäksi suunnittelemme FACET-sovellusliittymän perus fit / transform / ennustaa -paradigman mukainen skikit-oppii antamaan datatieteilijöille helpon alun FACETin kanssa.

2. SHAP -toteutusta Scott Lundbergin avulla arvioidaan SHAP-vektorit hajoavat synergiaan , irtisanomisen ja itsenäisyyden vektorit.

Vastaa

Sähköpostiosoitettasi ei julkaista. Pakolliset kentät on merkitty *