Görünüşe göre büyük platformların veri erişimini daha sıkı bir şekilde kısıtladığı büyüyen bir korumacı eğilim var. Bu durum, ChatGPT gibi büyük dil modellerinin daha yaygın bir başarı hikayesi haline gelmesiyle son zamanlarda ön plana çıkmıştır. Platformlar, verilerinin büyüyen endüstriyi beslemek için kullanıldığını ve kendilerine tazminat yapılmadığını endişeyle karşılıyor. Eğer web üzerinde daha kapalı bir davranışa yol açarsa, bu olumsuz bir eğilim haline gelecektir.

Koruma eğilimi - Reddit, şimdi Twitter Haziran ayında, Reddit API üzerindeki fiyatları artırdı. Reddit'in sahipleri, şirketi halka açmak için plan yapıyor ve bunu öncesinde sosyal haber sitesinden gelirlerini artırmayı amaçlıyor. Reddit'in kurucusu ve CEO'su Steve Huffman, The New York Times'a şunları söyledi: "Reddit veri kümesi gerçekten değerli, ancak bu değeri dünyanın en büyük şirketlerine ücretsiz olarak vermek zorunda değiliz."

Bu, platformda gönüllü moderatörler arasında süregelen bir greve yol açtı ve büyük bir aksaklığa neden oldu. Steve Huffman, işletmenin geri adım atmayacağını belirtti. The Associated Press'e şunları söyledi: "Protesto ve muhalefet önemlidir. Ancak bu durumda hiçbir şeyi değiştirmeyecektir çünkü işletme kararıyla pazarlık yapmıyoruz." Durum bir noktaya gelmiştir.

Dün, Elon Musk Twitter'ın günlük olarak okuyabileceğiniz gönderi sayısına bir sınırlama getirdiğini duyurdu. Bir tweetinde şunları söyledi:

"Çok fazla veri çekme ve sistem manipülasyonuyla başa çıkmak için geçici olarak aşağıdaki sınırlamaları uyguladık:

Doğrulanmış hesaplar, günde 6000 gönderi okumaya sınırlıdır. Doğrulanmamış hesaplar, günde 600 gönderiye sınırlıdır. Yeni doğrulanmamış hesaplar, günde 300 gönderiye sınırlıdır."

Daha sonra Musk, sırasıyla bu sınırları 10.000, 1.000 ve 500'e çıkardığını tweetledi.

Musk, "Yüzlerce kuruluş (belki daha fazlası) Twitter verilerini son derece saldırgan bir şekilde çekiyordu ve gerçek kullanıcı deneyimini etkiliyordu" dedi.

Bu tür bir ölçekte veri çekildiği gibi geliyor, ancak bu türden verileri toplamanın etkili bir yöntem olmadığı biraz garip. Twitter, bazı şirketlerin API erişimine ücretsiz erişimi sağlayarak ödeme yapmaktan kaçındıklarından endişe duysa bile, düzenli kullanıcıların kullanımını kısıtlamak kendi çıkarına zarar veren bir davranış gibi görünüyor. Genellikle, işletmeler mümkün olduğunca çok insanın hizmetlerini kullanmasını teşvik etmek ister çünkü bu şekilde para kazanırlar!

Nasıl sonuçlanacak?

Bunun nasıl sonuçlanacağını söylemek zor. Bu yeni alanı paraya dönüştürme mücadelesi. Veri sahipleri, dil modellerini daha insana benzer bir şekilde etkileşimde bulunmak için eğitmek için ana kaynaklardan biri olmaları durumunda pastadan pay istiyorlar. Bu durumun API erişimi için fiyatları artırmak için fırsatçı bir şekilde kullanıldığı da olabilir. Botlara suç atın! Gerçeklik hakkında bir şey bilmek, sahne arkasında olmadıkça zordur.

Kullanıcılar ortada kalırken zarar görmektedir. Üçüncü taraf uygulamaları için pazar daralır ve bazı küçük işletmeler için sürdürülemez hale gelebilir. Bu, tüketici seçimi açısından kötü bir durumdur.

Web standartları adapte olmalıdır. Şu anda, yapay zeka botları, arama motoru botları gibi sayfaları robots.txt dosyasına dayanarak dizinlemektedir. Dil modelleri için veri kullanımı izni açıkça belirtilmemiştir bildiğim kadarıyla. Bir botu engellemek için açıkça bir talepte bulunmanız gerekebilir. Örneğin, OpenAI, botunu engelleme talimatlarını yayınlamıştır.

Uzun vadede düzenlemelere ihtiyaç duyulması muhtemeldir. Büyük oyuncular büyük şirketler olduğu için büyük bir avantaja sahiptir. Agresif bir şekilde üstünlüklerini savunmak isteyip istemediklerine bağlı olacaktır.

Son olarak kişisel düşüncem, bunu endişe verici bir şey olarak görmüyorum. Bu, tanıdık bir mücadeledir. Sadece çözmemiz gereken bir şeydir.

Açık bilgi ve ticaret her zaman birbiriyle uyumsuz olmuştur. Bu, bilgi üzerindeki bir mücadeledir - kimin ürettiği, nasıl erişildiği ve kimin bunun için ödeme aldığı. Reddit'in durumunda, verilerinin ücretsiz olarak kullanıcılar tarafından düzenlendiği ve büyüyen bir maliyetle satıldığı görülmektedir - bu, AI devriminin bu tarafının nasıl gelişeceğini görmek için ilginç bir test olacak. Bu nasıl çözüleceği önemlidir çünkü webin ne olacağını şekillendirecektir.

Açıklığı korumaya çalışmalıyız, bu web için büyük bir güçtür. İş ihtiyaçlarını karşılayacak uygun bir ticari çözüm bulunmalıdır. Bulunamazsa, zararın düzenleme yoluyla en aza indirilmesi gerekmektedir.