Instagram a postat un articol care descrie mașinile din culise care completează fila Explorează pe Instagram cu lucruri noi, interesante, de fiecare dată când o deschizi. Este un pic tehnic, așa că iată cinci puncte de luat în considerare.

Chiar și Instagram și Facebook au resurse limitate

Spre deosebire de feedul, pe care unii îl preferă a fost pur și simplu cronologic, fila Explore trebuie condusă algoritmic. Însă a înțelege ce se întâmplă pe o rețea socială bazată pe imagini și a recomanda oamenilor un conținut nou este o problemă care este exact la fel de dificilă.

Dacă aceste companii ar avea o putere și un proces infinit de procesare, probabil că vor veni la întrebarea Explorează puțin diferit. Dar, așa cum este, ei trebuie să slujească sute de milioane de oameni, în timp scurt și doar enorm resurse de calcul. Cred că au pus acest lucru în partea de sus a postării, astfel încât oamenii să nu se întrebe de ce tăiau colțurile.

De asemenea, este mai ușor să experimentați și să repetați atunci când puteți schimba lucrurile și puteți vedea rapid rezultatele.

Totul ține de cont, nu de postare

Atât de mult este postat pe Instagram încât ar fi destul de imposibil să țineți evidența fiecărei fotografii individual, oricum în scopuri de recomandare. Este mai simplu și mai eficient de urmărit conturile, deoarece conturile tind să aibă teme sau subiecte, de la unul mai larg, cum ar fi „călătorie”, la ceva extrem de specific, cum ar fi, în special, sigiliile rotunde.

Deși să îți placi o postare dintr-un cont nu înseamnă neapărat că îți va plăcea orice altceva din acel cont, este un indicator bun că ești cel puțin interesat de tema respectivului cont. Chiar dacă v-ați dorit să vă simtă această postare particulară a acestei pisici, pentru că vă amintește de vechile Mittens, dacă doriți imagini dintr-un cont care postează mai ales pisici, acestea sunt informații valoroase.

Obiceiurile complexe informează algoritmul

În special, nu sunt doar funcțiile de imagine pe care Instagram le folosește pentru a-și da seama de conturile care sunt legate în mod topic, deși poate fi detectat și acest lucru. De asemenea, îți folosesc comportamentul.

De exemplu, atunci când vă plac mai multe postări la rând, este mai probabil să fie conectate într-un fel, chiar dacă algoritmii Instagram nu o pot vedea destul de mult:

Dacă o persoană interacționează cu o secvență de conturi în aceeași sesiune, este mai probabil să fie coerentă topic în comparație cu o secvență aleatorie de conturi din gama diversă de conturi Instagram. Acest lucru ne ajută să identificăm conturi similare topic.

Oamenii au doar tendința de a privi lucrurile în acest fel, trecând de la un cont axat pe călătorie la altul sau concentrându-se pe animale, deoarece au nevoie de un pick-me. Toate aceste informații sunt aspirate de algoritm și inspectate pentru relevanță. Desigur, acțiuni deliberate cum ar fi „vezi mai puține postări de genul acesta” și blocarea conturilor are și o greutate mare.

De la „conturi de semințe” la 25 de top

Procesul de a trece de la câteva miliarde de postări la doar două duzini poate fi destul de dificil, dar puteți reduce problema la dimensiunile gestionabile, limitând fila Explorare la conturile legate într-un fel de conturi pe care utilizatorul le-a plăcut sau le-a salvat postările din . Acestea sunt numite „conturi de semințe”, deoarece toate celelalte din proces cresc cu adevărat din ele.

Datorită modului în care sistemul de învățare automată reprezintă conturile și subiectele lor în sine, este foarte ușor să găsească câteva sute de conturi similare.

Imaginați-vă dacă știți că cineva îi place o anumită marmură de culoare roșiatică-portocalie și trebuie să găsiți ceva mai mult. Dacă doar scufundați mâna într-un sac de marmură, este puțin probabil să găsiți unul rapid. Chiar dacă le aruncați pe podea, va trebui totuși să vânați puțin. Dar, dacă le-ați organizat deja după culoare, tot ce trebuie să faceți este să ajungeți în vecinătatea generală a marmurei care le place și vă este aproape garantat să alegeți un câștigător.

Modelul de învățare automată face asta, oferind tuturor acestor conturi un fel de locație într-un spațiu virtual, iar cele două mai aproape sunt în acel spațiu, cu atât sunt mai aproape de actualitate.

Deci, partea cu adevărat dificilă de a împărți un set de miliarde la un set de sute este deja realizată prin modul în care sunt clasificate conturile.

De acolo Instagram face trei treceri cu rețele neuronale de o complexitate tot mai mare.

Primul, ușor confuz, este o versiune mai simplă, combinată a următoarelor două procese, care o ia de la 500 la 150 de conturi. Acest lucru este puțin ciudat, dar gândește-te în acest fel: această rețea neuronală a văzut pașii 2 și 3 se întâmplă de multe ori și are un frumos buna idee despre ceea ce fac. În felul acesta, dacă ați văzut cookie-urile s-au făcut de câte ori puteți ghici la o rețetă. Probabil că vă veți apropia, dar nici nu ați dori să-l publicați pentru a face față unei sute de milioane de oameni. Prin urmare, acest pas face doar chestiile evidente.

Al doilea este o rețea neuronală ieftin din punct de vedere al calculului, care utilizează mult mai multe semnale decât similitudinea topică simplă menționată mai sus. Iată unde intră în joc jucările tale individuale, precum și datele mai detaliate despre conturi. Îți plac călătoriile, sigur, dar în special îți plac cupluri călătorie – ambele lucruri pe care le poate ajuta algoritmul de sortare a marmurii de mai sus. Alți parametri, cum ar fi popularitatea generală a unei postări sau, de fapt, ființa ei diferit din celelalte postări din mix, figurați și ele. Asta înnebunește încă 100 din vârf, lăsând 50.

Al treilea este o versiune scumpă din punct de vedere al calculului de mai sus, care face o altă trecere a celor 50 și le taie la jumătate, practic, privind mai de aproape și luând timpul necesar pentru a include, poate, o mie de puncte de date fiecare, mai degrabă decât o sută.

Bănuiesc că a fost mult timp pentru o „luare de mâncare”. Nu vă faceți griji, următorul este rapid.

Și desigur, nu 🍑

„Vrem să ne asigurăm că conținutul recomandat este sigur și adecvat pentru o comunitate globală de mai multe vârste din Explore”, scrie ei. „Folosind o varietate de semnale, filtrăm conținutul pe care îl putem identifica ca nefiind eligibil pentru a fi recomandat.”

Acum știți de ce nu primiți nimic acea în Explore.

Sursa articol

LĂSAȚI UN MESAJ

Please enter your comment!
Please enter your name here