Oltre un decennio di contenuti preziosi per gli utenti sono ora in vendita, mentre Reddit si prepara a diventare pubblica.

Secondo quanto riportato ieri da Bloomberg, Reddit permetterà a “una grande azienda di AI senza nome” di accedere alla sua piattaforma di contenuti generati dagli utenti grazie a un nuovo accordo di licenza. L’accordo, “del valore di circa 60 milioni di dollari su base annua”, scrive l’agenzia, potrebbe ancora cambiare, dato che i piani della società di quotarsi in borsa sono ancora in corso.

Fino a poco tempo fa, la maggior parte delle aziende che si occupano di AI addestrava i loro dati sul web senza chiedere l’autorizzazione. Ma ciò si è rivelato discutibile dal punto di vista legale, inducendo le aziende a cercare di ottenere i dati su basi più solide. Non è noto con quale società Reddit abbia concluso l’accordo, ma si tratta di una cifra ben superiore ai 5 milioni di dollari annui che OpenAI avrebbe offerto agli editori di notizie per i loro dati. Secondo il New York Times, anche Apple sta cercando di concludere accordi pluriennali con le principali società di informazione per un valore di “almeno 50 milioni di dollari”.

Commento personale: dobbiamo prepararci ad una nuova ondata di iscrizioni su Lemmy? :) …oppure ancora una volta l’ennesimo passo falso non sarà sufficiente a smuovere le coscienze?

  • Novman@feddit.it
    link
    fedilink
    arrow-up
    4
    ·
    edit-2
    9 months ago

    In realtà un modo per peggiorare il lavoro dell’ai c’é. Se l’ia viene trainata con i suoi stessi dati ( o di un’altra ai ) il risultato peggiora. In poche parole l’ia ha bisogno di contenuti realmente umani per funzionare. Se si postano risposte create con chatgpt si riesce a far peggiorare l’ai.

    https://futurism.com/ai-trained-ai-generated-data-interview

    La qualità dell’ai dipende in modo sostanziale dalla qualità dei dati, ed è sempre stato così. È fondamentalmente un modello statistico. Oltretutto queste ai non vivono in un mondo simulato come quelle dei giochi, ma in un mondo reale e non possono migliorare “giocando contro se stesse” , devono confrontarsi con dati reali, non prevedibili in maniera deterministica.