Chagua Lugha

Mapendekezo ya Vitabu vya Sauti Vilivyobinafsishwa kwenye Spotify Kupitia Mitandao ya Neural ya Grafu

Mfumo wa kisasa wa 2T-HGNN wa Spotify unaochanganya Mitandao ya Neural ya Grafu ya Aina Mbalimbali na miundo ya Mnara-Mbili kwa mapendekezo ya vitabu vya sauti yanayoweza kupanuka, yakiwaongeza kiwango cha kuanza kwa +46%.
audio-novel.com | PDF Size: 1.0 MB
Ukadiriaji: 4.5/5
Ukadiriaji Wako
Umekadiria waraka huu tayari
Kifuniko cha Waraka PDF - Mapendekezo ya Vitabu vya Sauti Vilivyobinafsishwa kwenye Spotify Kupitia Mitandao ya Neural ya Grafu

Yaliyomo

1. Utangulizi

Spotify, jukwaa kuu la utiririshaji sauti linalowahudumia mamia ya mamilioni ya watumiaji, hivi karibuni limepanua orodha yake kujumuisha vitabu vya sauti pamoja na ofa zake zilizokua za muziki na podcast. Hatua hii ya kimkakati inaleta changamoto kubwa kwa mapendekezo yaliyobinafsishwa kutokana na uchache wa data, matatizo ya kuanza kwa baridi, na hatari kubwa ya mapendekezo ya vitabu vya sauti chini ya miundo ya awali ya mauzo ya moja kwa moja.

Changamoto kuu zilizobainika ni pamoja na:

  • Uhaba mkubwa wa data kwa aina mpya ya maudhui
  • Uvumilivu mkubwa wa hatari kwa mtumiaji kutokana na muundo wa ununuzi
  • Ishara dhabiti chache za mwingiliano chanya
  • Mahitaji ya uwezo wa kupanua kwa mamilioni ya watumiaji

+46%

Ongezeko la kiwango cha kuanza kwa vitabu vipya vya sauti

+23%

Kuongezeka kwa viwango vya utiririshaji

20%

Ukuaji wa kila mwaka wa matumizi ya vitabu vya sauti

2. Mbinu

2.1 Mitandao ya Neural ya Grafu ya Aina Mbalimbali

Mfumo wa 2T-HGNN unatumia grafu zenye aina mbalimbali zilizo na aina nyingi za nodi (watumiaji, vitabu vya sauti, podcast, nyimbo za muziki) na aina za uhusiano. Kwa kuwatenganisha watumiaji kutoka kwa muundo wa grafu, mfumo unafanikiwa kupunguza utata mkubwa hali inapodumisha ubora wa mapendekezo.

2.2 Muundo wa Mnara-Mbili

Mfano wa Mnara-Mbili hutenganisha uwakilishi wa mtumiaji na kipengee, na kuwezesha hesabu sahihi za ufanano na mapendekezo ya haraka. Muundo huu unahakikisha ucheleweshaji mdogo huku ukishughulikia kiwango cha msingi wa watumiaji wa Spotify.

2.3 Kichujio cha Majirani cha Viungo Vingi

Mbinu ya ubunifu ya kuchukua sampuli inayoshughulikia kwa ufanisi aina nyingi za uhusiano katika grafu ya aina mbalimbali, ikishughulikia tatizo la uchache wa data kwa kutumia uhusiano wa aina mbalimbali za maudhui.

3. Utekelezaji wa Kiufundi

3.1 Uundaji wa Kihisabati

Usambazaji wa msingi wa GNN unaweza kuwakilishwa kama:

$h_v^{(l+1)} = \sigma\left(\sum_{r\in R}\sum_{u\in N_v^r}\frac{1}{c_{v,r}}W_r^{(l)}h_u^{(l)} + W_0^{(l)}h_v^{(l)}\right)$

Ambapo $h_v^{(l)}$ inawakilisha upachikaji wa nodi $v$ kwenye safu $l$, $R$ ni seti ya aina za uhusiano, $N_v^r$ inaashiria majirani ya $v$ chini ya uhusiano $r$, na $c_{v,r}$ ni kiwango cha kawaida cha kawaida.

3.2 Utekelezaji wa Msimbo

class TwoTowerHGNN(nn.Module):
    def __init__(self, hidden_dim, num_relations):
        super().__init__()
        self.user_tower = nn.Sequential(
            nn.Linear(user_feat_dim, hidden_dim),
            nn.ReLU(),
            nn.Linear(hidden_dim, hidden_dim)
        )
        self.item_tower = HGNNLayer(hidden_dim, num_relations)
        
    def forward(self, user_features, item_graph):
        user_emb = self.user_tower(user_features)
        item_emb = self.item_tower(item_graph)
        return user_emb, item_emb

class MultiLinkNeighborSampler:
    def sample_neighbors(self, nodes, relation_types, fanouts):
        sampled_neighbors = {}
        for relation in relation_types:
            neighbors = self.graph.sample_neighbors(
                nodes, relation, fanouts[relation])
            sampled_neighbors[relation] = neighbors
        return sampled_neighbors

4. Matokeo ya Majaribio

Mfumo wa 2T-HGNN ulipimwa kwa mamilioni ya watumiaji wa Spotify, na kuonyesha uboreshaji wa kustaajabisha wa utendaji:

  • Ongezeko la +46% katika kiwango cha kuanza kwa vitabu vipya vya sauti ikilinganishwa na mbinu za msingi
  • Uboreshaji wa +23% katika viwango vya utiririshaji kwa maudhui yaliyopendekezwa
  • Madhara mazuri makubwa ya kumwagika kwenye bidhaa zilizokua kama podcast
  • Ucheleweshaji wa hitimisho uliopunguzwa kwa 40% ikilinganishwa na mbinu za kawaida za GNN

Mchoro wa muundo wa mfumo unaonyesha mtiririko kutoka kwa ujenzi wa grafu ya aina mbalimbali kupitia kuchukua sampuli ya viungo vingi hadi kuzalisha mapendekezo ya mwisho, na kuonyesha jinsi mapendeleo ya mtumiaji kutoka kwa muziki na podcast yanavyotumiwa kushughulikia matatizo ya kuanza kwa baridi ya vitabu vya sauti.

5. Uchambuzi Muhimu

Mtazamo wa Mchambuzi wa Sekta

Kukata Hadi Kiini (Kukata Hadi Kiini)

2T-HGNN ya Spotify sio tu mfumo mwingine wa kupendekeza - ni mbinu ya kimkakati ya ustadi ambayo inageuza uchache wa data kutoka kwa dhima kuwa silaha. Kwa kutumia uhusiano wa aina mbalimbali za maudhui, kimsingi wameunda daraja la mapendekezo ambalo huruhusu mapendeleo ya mtumiaji yaliyokua katika muziki na podcast kuanzisha aina mpya kabisa ya bidhaa. Hii ni akili zaidi kuliko kuchukulia vitabu vya sauti kama tatizo la mapendekezo pekee.

Mnyororo wa Mantiki (Mnyororo wa Mantiki)

Mantiki ya kiufundi ni razuri: Tatizo la kuanza kwa baridi → Tumia mapendeleo ya sasa ya mtumiaji → Jenga grafu ya aina mbalimbali → Tumia GNN kusambaza mapendeleo → Watenganishe watumiaji kwa uwezo wa kupanua → Pata mapendekezo ya aina mbalimbali za maudhui. Kinachofanya kuwa cha kipekee zaidi ni jinsi walivyobadilisha mbinu kutoka kwa kazi muhimu kama GraphSAGE ya Hamilton et al. na karatasi za GCN za Kipf & Welling, lakini kwa marekebisho muhimu kwa kuwekwa kwa kiwango cha viwanda. Tofauti na mbinu za kitamaduni ambazo hupambana na aina mpya za maudhui, mfumo huu kwa kweli unapata nguvu kutoka kwa anuwai iliyopo ya jukwaa.

Sehemu Zenye Mwangaza na Zenye Changamoto (Vipande Vilivyoangaza na Vilivyochoma)

Vipande Vilivyoangaza: Uboreshaji wa kiwango cha kuanza cha +46% ni wa kushangaza kwa aina mpya ya maudhui. Uamuzi wa kimuundo wa kuwatenganisha watumiaji kutoka kwa grafu unaonyesha uelewa wa kina wa vikwazo vya uwezo wa kupanua. Kichujio cha viungo vingi ni cha ubunifu kweli - kinakumbusha jinsi DeepMind ya Google inavyokaribia uundaji wa uhusiano tata, lakini inatumika kwa matatizo ya kiuchumi ya vitendo.

Vipande Vilivyochoma: Karatasi inapita juu ya gharama za hesabu - kufundisha GNN za aina mbalimbali kwa kiwango cha Spotify si rahisi. Pia kuna mjadala mdogo juu ya jinsi mfumo unavyoshughulikia tatizo la "kikopo cha kichujio" linalowakabili mifumo mingi ya kupendekeza. Tofauti na hatua zilizorekodiwa vizuri za anuwai za Netflix, mbinu ya Spotify inaonekana imeboreshwa sana kwa vipimo vya ushiriki ambavyo vinaweza kuimarisha mapendeleo yaliyopo badala ya kupanua upeo wa mtumiaji.

Msukumo wa Vitendo (Ufahamu Unaoweza Kutekelezwa)

Kwa washindani: Enzi ya mifumo ya mapendekezo yaliyotengwa imekwisha. Amazon Audible inapaswa kuogopa - Spotify imeonyesha jinsi mfumo duni wa jukwaa unaweza kutumika kutawala haraka katika kategoria mpya za maudhui. Kwa watendaji: Mbinu ya mtumiaji aliyeachwa inapaswa kuwa desturi ya kawaida kwa utekelezaji wa GNN wa kiwango kikubwa. Jamii ya utafiti inapaswa kuchukua noti - hii inawakilisha moja ya matumizi mafanikio zaidi ya ulimwengu halisi ya GNN za aina mbalimbali hadi sasa, na kushindana na kiwango cha kuwekwa kwa GNN ya Pinterest.

Kinachofanya hii kuwa muhimu hasa ni jinsi inavyolingana na mienendo pana katika ujifunzaji wa grafu. Kama ilivyoelezwa katika uchambuzi wa kina wa Zhou et al. wa GNN, uwezo wa kushughulikia mitandao ya habari ya aina mbalimbali inakuwa muhimu kwa matumizi ya ulimwengu halisi. Mbinu ya Spotify inaonyesha jinsi maendeleo ya kinadharia katika ujifunzaji wa uwakilishi wa grafu yanaweza kutafsiriwa kuwa thamani halisi ya biashara, sawa na jinsi Uber ilivyotumia GNN kwa utabiri wa ETA au jinsi Alibaba inavyotumia kwa mapendekezo ya bidhaa.

6. Matumizi ya Baadaye

Muundo wa 2T-HGNN una uwezo mkubwa zaidi ya mapendekezo ya vitabu vya sauti:

  • Mapendekezo ya kikoa cha kuvuka: Kupanua kwa video, makala, na aina nyingine za media
  • Sasisho za grafu zinazobadilika: Marekebisho ya haraka kwa mapendeleo yanayobadilika ya mtumiaji
  • Ujifunzaji wa shirikisho: Mapendekezo ya kulinda faragha bila kuweka data ya mtumiaji katikati
  • Ushirikisho wa hali nyingi: Kujumuisha vipengele vya sauti, maelezo ya maandishi, na sanaa ya kifuniko

Maelekezo ya utafiti wa baadaye ni pamoja na kuchunguza mienendo ya kitampo katika mapendeleo ya mtumiaji, kujumuisha grafu za ujuzi kwa uelewa wa maudhui, na kuunda algoriti bora zaidi za kuchukua sampuli kwa grafu za kiwango cha bilioni.

7. Marejeo

  1. Hamilton, W., Ying, Z., & Leskovec, J. (2017). Inductive Representation Learning on Large Graphs. NeurIPS.
  2. Kipf, T. N., & Welling, M. (2017). Semi-Supervised Classification with Graph Convolutional Networks. ICLR.
  3. Zhou, J., et al. (2020). Graph Neural Networks: A Review of Methods and Applications. AI Open.
  4. Rendle, S., et al. (2020). Neural Collaborative Filtering vs. Matrix Factorization Revisited. RecSys.
  5. Wang, X., et al. (2019). Heterogeneous Graph Attention Network. WWW.
  6. Spotify Technology S.A. (2023). Quarterly Financial Results.
  7. Audio Publishers Association. (2023). Annual Audiobook Sales Survey.