Vana, kullanıcıların yapay zekayı eğitmek için Reddit verilerini kiralamasına izin vermeyi planlıyor

Vana, kullanıcıların yapay zekayı eğitmek için Reddit verilerini kiralamasına izin vermeyi planlıyor

üretken olarak Yapay zeka patlaması, veriler yeni petroldür. Peki neden kendinizinkini satamıyorsunuz?

Büyük teknoloji firmalarından yeni kurulan şirketlere kadar yapay zeka üreticileri, daha yetenekli eğitim arayışı içinde, e-kitapları, görselleri, videoları, sesleri ve daha fazlasını veri komisyoncularından lisanslıyor (ve yasal olarak daha savunulabilir) Yapay zeka destekli ürünler. Shutterstock’un sahip olduğu fırsatlar Model eğitimi için milyonlarca görsel sağlamak üzere Meta, Google, Amazon ve Apple ile birlikte çalışırken, OpenAI de imzalanan anlaşmalar modellerini haber arşivleri üzerinde eğitmek için çeşitli haber kuruluşlarıyla birlikte çalışıyor.

Çoğu durumda, bu verinin bireysel yaratıcıları ve sahipleri, paranın bir kuruşunun bile el değiştirdiğini görmediler. Bir girişim adı verildi Eskimiş bunu değiştirmek istiyor.

MIT Medya Laboratuvarı’nda gelişen pazarlar için teknoloji oluşturmaya odaklanan bir sınıfta tanışan Anna Kazlauskas ve Art Abal, 2021’de Vana’yı kurdular. Kazlauskas, Vana’dan önce MIT’de bilgisayar bilimi ve ekonomi eğitimi aldı ve sonunda bir fintech kurmak üzere ayrıldı. otomasyon başlangıcı, Iambiq, Y Combinator’dan. Eğitim ve öğretimi kurumsal bir avukat olan Abal, veri açıklama şirketi Appen’de etki kaynağına başkanlık etmeden önce Boston merkezli bir danışmanlık firması olan The Cadmus Group’ta ortak olarak çalışıyordu.

Vana ile Kazlauskas ve Abal, kullanıcıların sohbetler, konuşma kayıtları ve fotoğraflar da dahil olmak üzere verilerini daha sonra üretken yapay zeka modeli eğitimi için kullanılabilecek veri kümelerinde “bir araya getirmelerine” olanak tanıyan bir platform oluşturmaya başladı. Ayrıca bu veriler üzerinde genel modellere ince ayar yaparak daha kişiselleştirilmiş deneyimler (örneğin, sağlıklı yaşam hedeflerinize dayalı günlük motive edici sesli posta veya stil tercihlerinizi anlayan sanat üreten bir uygulama) oluşturmak istiyorlar.

Kazlauskas, TechCrunch’a “Vana’nın altyapısı aslında kullanıcıya ait bir veri hazinesi yaratıyor” dedi. “Bunu, kullanıcıların kişisel verilerini gözetimsiz bir şekilde toplamasına olanak tanıyarak yapıyor… Vana, kullanıcıların yapay zeka modellerine sahip olmalarına ve verilerini yapay zeka uygulamalarında kullanmalarına olanak tanıyor.”

Vana şu şekilde platformunu ve API’sini geliştiricilere sunuyor:

Vana API, uygulamanızı kişiselleştirmenize olanak sağlamak için kullanıcının platformlar arası kişisel verilerini birbirine bağlar. Uygulamanız, kullanıcının kişiselleştirilmiş yapay zeka modeline veya temel verilerine anında erişim sağlayarak, katılımı basitleştirir ve bilgi işlem maliyeti endişelerini ortadan kaldırır… Kullanıcıların kişisel verilerini Instagram, Facebook ve Google gibi duvarlarla çevrili bahçelerden uygulamanıza getirebilmesi gerektiğini düşünüyoruz. Bir kullanıcının tüketici yapay zeka uygulamanızla ilk etkileşime girdiği andan itibaren muhteşem kişiselleştirilmiş deneyim yaratabilirsiniz.

Vana’da hesap oluşturmak oldukça basittir. E-postanızı onayladıktan sonra dijital bir avatara veri ekleyebilir (selfie’ler, kendinizin açıklaması ve ses kayıtları gibi) ve Vana’nın platformu ve veri kümeleri kullanılarak oluşturulan uygulamaları keşfedebilirsiniz. Uygulama seçimi, ChatGPT tarzı sohbet robotlarından ve etkileşimli hikaye kitaplarından Hinge profil oluşturucuya kadar uzanır.

Vana Reddit DAO

Resim Kredisi: Eskimiş

Şimdi, veri gizliliği farkındalığının ve fidye yazılımı saldırılarının arttığı bu çağda, neden birisi kişisel bilgilerini girişim destekli bir girişim şöyle dursun, anonim bir girişime gönüllü olarak verir mi diye sorabilirsiniz. (Vana bugüne kadar Paradigm, Polychain Capital ve diğer destekçilerden 20 milyon dolar topladı.) Kâr odaklı herhangi bir şirketin, eline geçen para kazandırabilir verileri kötüye kullanmayacağına veya yanlış kullanmayacağına gerçekten güvenilebilir mi?

Vana Reddit DAO

Resim Kredisi: Eskimiş

Bu soruya yanıt olarak Kazlauskas, Vana’nın asıl amacının kullanıcıların “verileri üzerindeki kontrolü geri almaları” olduğunu vurguladı ve Vana kullanıcılarının, Vana’nın sunucularında depolamak ve verilerinin nasıl yönetileceğini kontrol etmek yerine verilerini kendileri barındırma seçeneğine sahip olduğunu belirtti. veriler uygulamalar ve geliştiricilerle paylaşılır. Ayrıca, Vana’nın kullanıcılardan aylık abonelik (3,99 dolardan başlayan) talep ederek ve geliştiricilerden (örneğin yapay zeka modeli eğitimi için veri setlerini aktarmak için) bir “veri işlemi” ücreti alarak para kazanması nedeniyle şirketin kullanıcıları istismar etme konusunda caydırıcı olduğunu savundu. yanlarında getirdikleri kişisel veri hazineleri.

Kazlauskas, “Hepsi verileriyle katkıda bulunan, sahip olunan ve yönetilen kullanıcılar modelleri oluşturmak ve kullanıcıların verilerini ve modellerini herhangi bir uygulamaya yanlarında getirmelerine olanak sağlamak istiyoruz” dedi.

Şimdi, bu arada Eskimiş üretken yapay zeka modeli eğitimi için kullanıcıların verilerini şirketlere satmıyor (veya öyle olduğunu iddia ediyor), Reddit gönderilerinden başlayarak kullanıcıların isterlerse bunu kendilerinin yapmalarına izin vermek istiyor.

Bu ay Vana, “The Guardian” adını verdiği şeyi başlattı. Reddit Data DAO (Dijital Özerk Organizasyon), birden fazla kullanıcının Reddit verilerini (karma ve gönderi geçmişleri dahil) bir araya toplayan ve bu birleştirilmiş verilerin nasıl kullanılacağına birlikte karar vermelerine olanak tanıyan bir programdır. Reddit hesabıyla katıldıktan sonra, rica etmek Verileri için Reddit’e gönderilen ve bu verileri DAO’ya yükleyen kullanıcılar, birleştirilmiş verilerin ortak kâr için üretken yapay zeka şirketlerine lisanslanması gibi kararlarda DAO’nun diğer üyeleriyle birlikte oy kullanma hakkını elde ediyor.

Bu Reddit’in sorusuna bir nevi cevap son hamleler Verileri kendi platformunda ticarileştirmek.

Reddit daha önce üretken yapay zeka eğitimi amacıyla gönderilere ve topluluklara erişimi kapatmıyordu. Ancak geçen yılın sonlarında halka arz öncesinde rotayı tersine çevirdi. Politika değişikliğinden bu yana Reddit, aralarında Google’ın da bulunduğu şirketlerden 203 milyon doların üzerinde lisans ücreti aldı.

“Geniş fikir [with the DAO is] Kazlauskas, kullanıcı verilerini istiflemeyi ve para kazanmayı amaçlayan büyük platformlardan kurtarmak için “dedi. “Bu bir ilk ve insanların yapay zeka modellerini eğitmek için verilerini kullanıcıya ait veri kümelerinde bir araya getirmelerine yardımcı olma çabamızın bir parçası.”

Vana ile herhangi bir resmi sıfatla çalışmayan Reddit’in DAO’dan memnun olmaması şaşırtıcı değil.

Reddit Vana’yı yasakladı alt düzenleme DAO hakkındaki tartışmalara adanmıştır. Ve bir Reddit sözcüsü, Vana’yı, GDPR ve Kaliforniya Tüketici Gizliliği Yasası gibi veri gizliliği düzenlemelerine uyacak şekilde tasarlanan veri dışa aktarma sistemini “istismar etmekle” suçladı.

Sözcü TechCrunch’a şöyle konuştu: “Veri düzenlemelerimiz, kamuya açık bilgiler dahil olmak üzere bu tür varlıklara korkuluklar koymamıza olanak tanıyor.” “Reddit, kamuya açık olmayan kişisel verileri ticari kuruluşlarla paylaşmaz ve Redditçiler, verilerinin bizden dışa aktarılmasını talep ettiğinde, yürürlükteki yasalara uygun olarak, kamuya açık olmayan kişisel verileri bizden geri alırlar. Reddit ve denetlenen kuruluşlar arasında açık şartlar ve sorumluluklar içeren doğrudan ortaklıklar vardır ve bu ortaklıklar ve anlaşmalar, insanların verilerinin kötüye kullanılmasını ve kötüye kullanılmasını önler.

Peki Reddit’in endişelenmek için gerçek bir nedeni var mı?

Kazlauskas, DAO’nun Reddit’in verileri için müşterilerden talep edebileceği tutarı etkileyecek noktaya kadar büyüyeceğini öngörüyor. Bunun gerçekleşeceğini varsayarsak, bu çok uzak bir ihtimal; DAO’nun 141.000’den biraz fazla üyesi var; bu, Reddit’in 73 milyonluk güçlü kullanıcı tabanının çok küçük bir kısmı. Ve bu üyelerden bazıları botlar veya kopya hesaplar olabilir.

Bir de DAO’nun veri alıcılarından alabileceği ödemelerin adil bir şekilde nasıl dağıtılacağı meselesi var.

Şu anda DAO, Reddit’lerine karşılık gelen kullanıcılara “jetonlar” (kripto para birimi) veriyor karma. Ancak karma, veri setine yapılan kaliteli katkıların en iyi ölçüsü olmayabilir; özellikle de karma kazanma fırsatlarının daha az olduğu daha küçük Reddit topluluklarında.

Kazlauskas, DAO üyelerinin platformlar arası ve demografik verilerini paylaşmayı seçebilecekleri fikrini ortaya atıyor, bu da DAO’yu potansiyel olarak daha değerli hale getiriyor ve kaydolmaları teşvik ediyor. Ancak bu aynı zamanda kullanıcıların hassas verilerinin sorumlu bir şekilde ele alınması konusunda Vana’ya daha fazla güvenmelerini de gerektirecektir.

Şahsen Vana’nın DAO’sunun kritik kütleye ulaştığını düşünmüyorum. Yolda duran barikatlar çok fazla. Ancak bunun, üretken yapay zeka modellerini eğitmek için giderek daha fazla kullanılan veriler üzerinde kontrol sağlamaya yönelik tabandan gelen son girişim olmayacağını düşünüyorum.

gibi girişimler Yumurtlama Getty Images, Shutterstock ve Adobe gibi sağlayıcılar ise içerik oluşturucuların verilerinin eğitim için nasıl kullanılacağını yönlendiren kurallar koymasına izin verecek yollar üzerinde çalışıyor. tazminat planlarını deneyin. Ama henüz kimse şifreyi kıramadı. Hatta yapabilir mi olmak çatlamış mı? Verilen kıyasıya doğa Üretken yapay zeka endüstrisi için bu kesinlikle zor bir iş. Ancak belki birileri bir yol bulacaktır ya da politika yapıcılar bunu zorlayacaktır.

Yorum gönder