Oltre un decennio di contenuti preziosi per gli utenti sono ora in vendita, mentre Reddit si prepara a diventare pubblica.
Secondo quanto riportato ieri da Bloomberg, Reddit permetterà a “una grande azienda di AI senza nome” di accedere alla sua piattaforma di contenuti generati dagli utenti grazie a un nuovo accordo di licenza. L’accordo, “del valore di circa 60 milioni di dollari su base annua”, scrive l’agenzia, potrebbe ancora cambiare, dato che i piani della società di quotarsi in borsa sono ancora in corso.
Fino a poco tempo fa, la maggior parte delle aziende che si occupano di AI addestrava i loro dati sul web senza chiedere l’autorizzazione. Ma ciò si è rivelato discutibile dal punto di vista legale, inducendo le aziende a cercare di ottenere i dati su basi più solide. Non è noto con quale società Reddit abbia concluso l’accordo, ma si tratta di una cifra ben superiore ai 5 milioni di dollari annui che OpenAI avrebbe offerto agli editori di notizie per i loro dati. Secondo il New York Times, anche Apple sta cercando di concludere accordi pluriennali con le principali società di informazione per un valore di “almeno 50 milioni di dollari”.
…
Commento personale: dobbiamo prepararci ad una nuova ondata di iscrizioni su Lemmy? :) …oppure ancora una volta l’ennesimo passo falso non sarà sufficiente a smuovere le coscienze?
In realtà un modo per peggiorare il lavoro dell’ai c’é. Se l’ia viene trainata con i suoi stessi dati ( o di un’altra ai ) il risultato peggiora. In poche parole l’ia ha bisogno di contenuti realmente umani per funzionare. Se si postano risposte create con chatgpt si riesce a far peggiorare l’ai.
https://futurism.com/ai-trained-ai-generated-data-interview
La qualità dell’ai dipende in modo sostanziale dalla qualità dei dati, ed è sempre stato così. È fondamentalmente un modello statistico. Oltretutto queste ai non vivono in un mondo simulato come quelle dei giochi, ma in un mondo reale e non possono migliorare “giocando contro se stesse” , devono confrontarsi con dati reali, non prevedibili in maniera deterministica.